英文の意味を理解しないといけない…そんな時、皆さんは機械翻訳を利用しますか? 機械翻訳とは異なる言語間の翻訳をコンピューターにより全自動で行うものです。近年ではインターネット上に無料で利用できるサービスもあるため、英語の文章を読む時に利用する人も多いのではないでしょうか。少し前までは機械で翻訳した文章なんて読めたものじゃなかったのに、最近はすごく良い翻訳をしてくれるなあ…もしそう感じているとしたら、その感覚は正しいです。今回は翻訳界に新風を巻き起こした「DeepL」についてご紹介したいと思います。
【岐路と衝撃】
機械翻訳の世界には何度か大きなターニングポイントがありました。その中でも大きかったのが、2016年にGoogle翻訳が提供開始したディープラーニング(深層学習)を活用した機械翻訳です。
これまでは実用に堪えないと思われていたものが、「翻訳は機械にさせれば良い」と思われるようになったのは間違いなくこの出来事がきっかけでした。ディープラーニングを用いた機械翻訳はこれまでのものに比べてあまりにも性能が高かったのです。そのため、機械翻訳界で今後このような衝撃を与えられることはもうないだろうとまで思われました。そんな中、彗星のごとく登場したのが、DeepLでした。
DeepLはドイツのケルンに本拠地を置くDeepL GmbHが17年8月から提供している機械翻訳です。長らく日本語には対応していなかったのですが、当初からその性能の高さは日本においても話題になっていました。満を持して20年3月、ついに日本語に対応し、その精度の高さに我々は衝撃を受けたのでした。
【すごいぞDeepL】
DeepLの翻訳のすごさは、翻訳後の日本語の読みやすさにあります。ただ正しく訳すのではなく、いかに自然かという点が他の翻訳サービスと一線を画すところです。
まずは単純な例をお見せしましょう。「Takecareofyourself」という英語の文を訳してみましょう。直訳すれば「自分自身を大切にしてください」となります。
自分自身(yourself)を大切に(Takecare)ですので間違ってはいませんが、実際に日本語で「自分自身を大切にしてください」と言うかは疑問が残ります。この文をDeepLで翻訳すると「お大事に」と訳されました。DeepLはただの直訳でない、非常に自然な表現で翻訳されていることがお分かりいただけると思います。
もう少し長い文の翻訳結果も見てみましょう。ウィキペディアの英語の「翻訳」のページに書かれている「Translationisthecommunicationofthemeaningofasource―languagetextbymeansofanequivalenttarget―languagetext.」を訳してみましょう。
まずは直訳です。「翻訳とは、同等のターゲット言語のテキストによって、ソース言語のテキストの意味を伝達することです。」と訳すことができます。訳としては正しいですが、日本語としては違和感があります。DeepLはこの文を「翻訳とは、原文の意味を同等の訳文によって伝えることである。」と訳しました。DeepLの翻訳結果は日本語として自然で、すんなりと頭に入ってきます。このようにDeepLはただ正しく翻訳するだけでなく、自然な日本語で表現してくれるのです。
しかし、これは危険性もはらんでいます。それは文章を読みやすくするが故に、情報を必要以上にそぎ落としてしまったり、意味自体を変えてしまったりする可能性があるということです。もちろんこれはDeepLに限った問題ではありません。
DeepLに限らず機械翻訳を用いる場合は、最終的には自分で内容を確認する必要がまだあります。ただ、たとえそうだったとしても、DeepLを活用することで翻訳の煩わしさを大幅に軽減できるのは間違いないでしょう。
【DeepLのすごさの秘密】
DeepLがなぜこのように自然な翻訳ができるのかについては、DeepL自身が4つのポイントについて公表しています。ここではその中でも筆者が特に注目した「AIに学習させるデータの収集に重点を置いている」点を取り上げます。
AIはデータが命です。AIの性能は質の良いデータを、いかに大量に集められるかにかかっているといっても過言ではありません。一方で質の良いデータを集めるのは非常に大変な作業であるため質についてはある程度目をつむり、とにかく膨大な量のデータを集めることに集中することが多いのも実情です。そんな中、データの質にもこだわったことがDeepLのこの性能を引き出したのだと考えられます。
DeepLの登場は、それまでの機械翻訳の性能を一段高い位置に押し上げました。もう来ないと思っていた衝撃が起こったこと、これは機械翻訳が今後も素晴らしい進化を遂げるに違いないことを示しています。この次、我々に衝撃を与えてくれるものがDeepLなのか別のものかはわかりません。ただ機械翻訳は今後も進化し続け、近い将来、私たちの間にある言語の壁を完全に打ち破ってくれることでしょう。
☆おおにし・かなこ 愛媛県出身。2012年お茶の水女子大学大学院博士後期課程修了。博士(理学)。同年、NTTドコモ入社。16年から2年間、情報通信研究機構に出向。一貫して雑談対話システムの研究開発に従事。20年から大手IT企業でAIの導入や設計をリード。AIに関する講演や執筆、監修等も行う。著書に「いちばんやさしいAI<人工知能>超入門」「超実践!AI人材になる本」。