12/04/15

機械翻訳の可能性

今週は大きなニュースがいっぱいあった。まずは、北朝鮮のミサイル発射が一番大きなニュースだろう。巨額の費用をかけて、さらに国家の威信もかけて発射したミサイルが、発射直後に爆発したというのも北朝鮮らしくて微笑ましいが、そんなお粗末なミサイル発射に右往左往して、政府の正式発表が大幅に遅れたというのも、いかにも日本らしくて情けない。

もう一つの大きなニュースとしては、やはり木嶋佳苗被告の死刑判決だろう。物証が何もないこの事件は、プロですら判決を下すのは難しい裁判だと言われていたから、裁判員を任された人たちの心労は並大抵のものではなかっただろう。しかし、個人的には妥当な判決だったと思う。

決め手となる物証がなく、状況証拠の積み重ねだけで立証しなければならかった検察としても辛いところだっただろうが、論告求刑で検察側が述べた「窓の外には夜空が広がっている。夜が明けると、雪化粧になっている。雪がいつ降ったかを見ていなくても、夜中に降ったと認定できる」という主張には、なるほど、こういうレトリックもあるのかと、少しだけ感動した。

さて、そんなビッグニュースのことはさておき、今回は機械翻訳のことについて書いてみたい。本当は、北朝鮮のミサイル発射か、木嶋佳苗たんの死刑判決か、どちらかのニュースについて書こうと思っていたのだが、ネットのニュースをチェックしていたら、ものすごく香ばしいニュースが見つかったので、今回はこれをネタにして書いてみようと思う。

どんなニュースかというと、東北観光博というホームページで多くの誤訳(日本語→英語)が見つかったという、一見するとつまらないニュースだ(こちらを参照)。ホームページの誤訳なんて、それほど珍しいものでもないし、その気になればいくらでも見つかる。むしろ、誤訳のないホームページなんて見たことがない。

しかし、今回のこの誤訳は相当にすごい。何の気なしに見ていたら、思わず噴き出してしまったくらいにそのギャグレベルは高い。詳しい誤訳例はこちらを見てもらえればわかるが、話の都合でここにも転載しておこう。

「赤神神社五社堂」の英訳が「Five red gods company temples」で、

「あきた千秋公園桜まつり」の英訳が「Senshu park cherry tree Festival which we got tired」で、

「八津・鎌足かたくり群生の郷」の英訳が「Is eight Tsu, pigeon-toedness, or roll up; gregarious volost」といった感じで、どれも傑作だ。

当然ながら、これらの翻訳はすべて機械翻訳で作られたものらしい。たしかに、機械翻訳以外で、こんな珍妙な翻訳はあり得ないだろう。もし、これが人間の翻訳だったら、むしろこんなものすごい翻訳を思いついた人を尊敬する。

何がすごいかと言えば、「赤神神社五社堂」が「Five red gods company temples」というのはまだしも、「あきた千秋公園桜まつり」の訳が「Senshu park cherry tree Festival which we got tired」というのは、まず普通のセンスでは思いつかない。お祭りなのにいきなり飽きたのかよと、さまぁ〜ずの三村みたいなツッコミをしそうだ。

もっとすごいのが最後の文章だ。「八津」の訳が、なぜいきなり「Is」で始まるのか、あれこれ考えたのだがよくわからない。とにかく、この訳文は謎だらけで、「鎌足」がなぜ「pigeon-toedness」になるのかもわからないし、「かたくり」がなぜ「roll up」になるのかもわからない。「群生」が「gregarious」というのだけは、かろうじてわかる程度だ。

このホームページを作成した人は、きっと翻訳代をケチって、自分で機械翻訳をしたのだろう。それで、その訳文をチェックすることなく、そのまま載せてしまったのだろう。つまり、一般人の機械翻訳に対する信頼度は、かなり高いということになる。これは、翻訳を仕事にしている人間にとっては由々しき問題だ。

たしかに、以前と比べれば、多少は機械翻訳のレベルも上がっているのかもしれないが、まだまだ実用レベルとは言えない。いくらハードウェアの性能が上がっているとは言っても、肝心のソフトウェアが進化しなければどうしようもない。コンピュータは、大量の計算を高速で処理するのは大の得意だが、あいまいな文章を高度な推測によって処理していくというのは、大の苦手なのだ。

ただ、こうしたあいまいさを完全に取り除いた文章であれば、機械翻訳の出番はある。たとえば、取扱説明書の文章などは、一定のルールを決めてそれに従った原文を書けば、機械翻訳で大部分を処理できる可能性はある。こうした文書では、操作手順を箇条書きにしているだけだから、機械翻訳が最も得意とするところだ。

しかし、それ以外の文書では、機械翻訳の出番はほとんどないと言ってもいいと思う。最初に機械翻訳をとおして訳文を作り、その訳文を手直ししていけば多少は効率が上がるという考えもあるかもしれないが、こうした方法で本当に効率アップにつながるのか疑問だ。

たとえば、「しかし、それ以外の文書では、機械翻訳の出番はほとんどないと言ってもいいと思う」という文章をGoogle翻訳で訳してみると、「However, I think can say in writing otherwise, turn the machine translation is unlikely」という文章が出てきた。何が言いたいのか、さっぱりわからない。これを手直しするくらいなら、文章を一から作った方が早い。

ということで、機械翻訳が活躍する時代というのは、まだまだ先のことになりそうだ。いずれは機械が人間の思考に追いつく日がくるのかもしれないが、少なくとも、自分が生きているうちは、完全な機械翻訳が登場することはないと断言してもいいだろう。そんなものができてしまった日には、翻訳者はすべて廃業に追い込まれてしまう。




今週の覚書一覧へ

TOP