機械翻訳の実用化について

なんでも評点:なぜ自動翻訳は使い物にならないのか? ― 翻訳を生業とする立場と経験から分析してみる

えーっと、AI に近いところにおって、
色々思うところがあるわけで、
ちょっと書いてみる。
エンドユーザはこう思っているのかーと、
なかなか興味深いのだが。

まず、なぜ自動翻訳は使い物にならないのか?というタイトルだが、
使い物になるわけがない。

この人も書いているように、
印欧語同士でない翻訳、例えば日英/英日などは、
単語と単語の意味が、ぴったりと対応しているわけではない。
例えば、日本語の「糠雨」と「霧雨」を区別できる英単語はあるだろうか。
アラブの方には、たくさんのラクダをあらわす単語があるらしい。
日本語では多分「○○なラクダ」としか言いようがない。
そして面倒なことに、「糠雨」と「霧雨」はちょっとニュアンスが違う。
糠雨の方が湿度が高くてしっとり感があるが、ベタベタではない。
降るなら春先かな、みたいな。
そこまではさすがに翻訳できない。
翻訳家なら、そのニュアンスも加味して翻訳することができるかもしれない。
そんなわけで、単語と単語の置き換えだけでは、まずうまくいかない。
文脈を解析して、意味を理解した上での置き換えなら、
うまくいくかもしれないが、
現在の技術では、意味解析の実用化はまだ無理。
オントロジーだのセマンティック web だのも、
一時期流行したものの、
現在は、なんか良さそうだけど何に使おうか?という感じ。
実際に動くようになるのは 20 年後くらいじゃないか。
現在使われている形態素解析だって、
実は 20-30 年くらいは研究され続けてきているのだから。

使い物にならない理由として、ほかに挙げられるのは、
チューニングができないということ。
チューニングするには、バイリンガルの協力が不可欠だが、
翻訳家は「精度が上がると自分たちの仕事がなくなる!」と思って、
なかなか協力してくれない。
人間の仕事がなくなるほど精度が上がるなんて、
現在のところはまったく考えられないのだが、
説明してもわかってくれない。
結果、日本語ネイティブがあーでもないこーでもないと、
英語のチューニングをしていたりする。
精度の上がりようがない。
上記リンクの人は理解があるが、
大多数の翻訳家は、この人ほど理解がない。

現在、ホワイトボックステストでも
多分精度は 7-8 割くらいだろうと思う。
ここまでは割とサクサクと来るのだが、実はここからが難しい。
ここから精度を 1% 上げるのに数年かかったりするのだが、
普通の人には「精度が 1% 上がりましたー!」と言っても、
「…で?」と言われるだろう。
企業としても、精度を上げる方向で開発を続けづらい。
ここ 10 年くらいで開発をやめちゃった企業もたくさんある。
こういうのは知識の蓄積でできているので、
一度やめちゃうと、多分もう二度と開発を始められない。
例えば、アメリカは大昔に「機械翻訳なんてクソ」と開発をやめてしまったので、
その分野では、ヨーロッパに大分遅れを取っている。

ま、そんなこんなで、全自動で機械翻訳なんて、まだまだ無理。
できるかも!と思ってる人って結構いるのかな。

上記記事へのツッコミ。
使えない例として、google の翻訳をあげているが、
これは大変にひどい例なので、
例としては如何なものか。
結果から見るに、google のは
統計的手法を主にした機械翻訳なのだろうと思う。
これは学習に食わせるドキュメントの質と量で、格段に差が出る。
forgot なんか入れると、パスワード云々なんて日本語が出ていたので、
食わせているのはきっとマニュアルとか、そういう類の文書。
学習データにあわせて、ニュースよりもマニュアルを入力にしたら、
もうちょっと質が良いものが出力されるかも。
学習に使う文書だが、
日英の対がそろっている文書なんて、実はそうたくさんない。
購入することもできるが、結構お高くてよ。
多分、google のは学習量が足りなすぎ。
他のルールベースのサービスに比較できる品質になるには、
まだ大分お金をかける必要があるが、
翻訳サービスにそれだけの価値を見出すかどうかは、google 次第。
個人的には、全然期待していない。

統計的手法はここ 10 年くらいにホットになったが、
従来のルールベースほど精度が出ないということで、
統計とルールを両方使うほうが良さそう、ということで FA になっている。
ところが、統計的手法のエンジンは比較的簡単に構築できるが、
ルールを記述するのは、
それなりにシステムもルール全体もわかっていないとダメ。
新しくルールを入れたら、別の方がおかしくなった、ということが良くある。
だから、ルールをユーザにカスタマイズさせないのは、そういう理由。
「筆者の構想:完全にプログラミング可能な翻訳システム」の内容が
実現されていないのも、そういう理由による。
作る側は「ユーザは何をしでかすかわからない人」という思想でソフトを作る。
ある程度コンピュータリテラシの高い人を想定してソフトを作ったとして、
それが何本売れるだろう?
それよりは「どんな人でもOK」というソフトを作ったほうが、
明らかに売れる。
たとえ、訳がかなりおかしいとしても、である。

半自動の翻訳機能を人間が操作しながら翻訳出力を生み出すシステムを
目指していれば、もっと使えるものが出来ていた可能性もある。

とあるけれど、実は既に存在する。
汎用性を目指すと帯にもたすきにもならないのは、
開発の人もわかっているので、
分野を特定すれば良いのでは?というのは、誰でも考え付く。
企業としても、いつまで経っても実用化できない開発は続けられないが、
多少でも実用化できれば、開発費が一部でも回収できるかもしれない。
実際、欧州では、天気予報というジャンルに限って、
欧州内の各言語に翻訳するシステムが、大分前から稼動している。
それを日本でもと思うのは当然。
なわけで、実際にある。
でも、企業の中で使われているので、一般の人が知らないだけ。
天気予報じゃなくて、アレとかコレとか。
ちょっと書けないけど。

翻訳メモリに関しては、
翻訳家の間で必須なツールであることは、開発側もわかっている。
しかし、シェアはほぼ TRADOS の寡占状態なので、
TRADOS と提携するのも難しいし、
新規に作った別の翻訳メモリ+翻訳ソフトに
乗り換えてもらうのも難しい。

翻訳家の人の気持ちもわかるんだけど、
色々オトナの事情というのがあるのだよ。

ここまで書いたのは、ちょっと前の AI 業界近所の話。
今はもうちょっと違う状況なのかな。
[PR]
by xiaoxia | 2008-09-25 14:46 | コンピュータ関係 | Comments(0)

ダメ女プログラマ&主婦&腐女子&バイオリン弾き


by 小霞