機械翻訳は語学学習の代用にはならない

ご好評いただいている「世界共通語シリーズ」(笑)。

英語は人類最後の世界共通語になるだろう - Rails で行こう!

中国語が世界共通語になる条件 - Rails で行こう!

私は繰り返し「これからもずっと英語は世界共通語であり、その重要性はますます増すので、若い人ほど一生懸命勉強するべきだ。これから生まれる子供たちについては、低年齢からの英語教育が必要だ」と主張してきた。

すると「機械翻訳の精度がこの先急速に上がるから、語学学習の必要はなくなる」という人が必ず出てくる。この点については識者の間ではすでに「無理」ということで合意ができているかと思っていたのだが、案外世間では知られていないようだ。

次のエントリは秀逸だ。

なんでも評点:なぜ自動翻訳は使い物にならないのか? ― 翻訳を生業とする立場と経験から分析してみる

女プログラマってどうよ? : 機械翻訳の実用化について

機械翻訳の歴史は古い。1940年代にコンピューターが発明されてまもなく、研究が始まっている。構文解析によって、原語を分析し、翻訳語を生成するルールベースの機械翻訳だった。それが行き詰ると、今度は統計的機械翻訳という分野が注目された。大量に用意された2つの言語の文の対に基づいて、最も確からしい翻訳結果を出力するシステムである(Google 翻訳がこの一例だ)。

機械翻訳では、文章が定型的で、2つの言語が文法的によく似ている場合、かなりよい精度で翻訳できる。英語とオランダ語、フランス語とイタリア語、日本語と韓国語などでは、ほぼ実用水準に達している。

しかし、文章が少しでも型を外れると、とたんに翻訳精度が下がる。また言語間の距離が遠ざかると、まともな文章が出力されない。日本語と英語などという関連性がほぼゼロの言語同士だと、惨めな結果しか得られない。

熱心に研究している人たちには気の毒だが、現在の手法では永遠に汎用的で精度の高い機械翻訳は不可能だろう。

なぜか。答えは簡単だ。機械に文章の「意味」が理解できないからだ

日本語と英語の間の翻訳をやったことのあるひとなら誰でも分かるはずだ。日本語と英語の間では逐語訳ができない。つまり単語を置き換え、語順を並び替えるだけでは翻訳不可能なのだ。まず文章の意味を理解し、文化的な差異を配慮したうえで、翻訳しなければ読者に理解できる文章にならない。

日本語の文章を英語に翻訳するのは非常に難しい。なぜなら、日本語は主語や動作対象の省略が通常なのに対して、英語ではそれらの要素を必ず指定しなければならないからだ。日本語の文章を英語に訳すとき「あれ?これは誰が言ってるんだ?」「この動作の対象は何か?」という疑問が湧いてくることが多い。つまり、その文章の意味を理解しないと、翻訳できないのである。

(ちなみに英語から日本語に訳すときは、英語では表現されていた多くの要素を切り捨てないと自然な日本語にならない。この点で、日本語というのは単位空間あたりで表現される情報量が少なくなってしまいがちな言語だな、と思う。「日本語が非論理的」と主張する人たちはこの現象を指しているのではないか)

私は永遠に機械翻訳が実現しないと言っているのではない。その必要条件は「意味が理解できる機械」の誕生だと言いたいだけだ。

「意味が理解できる機械」については、現在、まったく実用化のメドが立っていない。現在のノイマン型と呼ばれる動作原理のコンピュータがいくら進歩しても、意味が理解できる機械にはならないだろう。私たちは、「意味が理解できる機械」の実用化を待っているという意味では、コンピュータ発明以前の人たちとなんら変わらない立場にいるのだ。

というわけで、ごく限定的な用途を除くと、機械翻訳が私たちの生活を大きく変えることは(残念ながら)当分ないだろう。日本人は、機械翻訳に期待せず、自分の頭を使って英語を学ぶべきだ。

P.S.

現在、定型的な文章の翻訳者の間では「翻訳メモリ」と呼ばれる翻訳支援ソフトウェアが使われるのがあたりまえになっているとのこと。これは、大量の対訳を段落単位に用意しておいて、原語の段落に最も適合する対訳を検索表示できるシステムらしい。統計的手動翻訳というところか。これは、現在のコンピュータの動作原理に忠実なソフトウェアであり、この方向の進化は期待できるのではないだろうか。