意外と知らない?機械翻訳と翻訳家の違い。コンボで最強!


先日、社内・ビジネス向けチャットツール『Slack』が日本語にも対応しました。
様々なサービスやツールなどが海外市場へ進出するためにローカライズ・多言語化を実施しています。ローカライズ・多言語化には、もちろん他の作業も含まれていますが、翻訳が大部分を占めているでしょう。

では、翻訳は誰に頼めばいいのでしょうか。機械にやってもらう?それともプロの翻訳家?

 

1. 翻訳の今

こんにちは、そして初めまして。ダンテ・タカと申します。英語を教え、翻訳をしています。
機械翻訳の精度が日に日によくなっており、仕事がなくなるのでは、と私が将来へ抱く不安は膨張しています。同じような不安を抱いている翻訳家もたくさんいるはずです。

しかし、機械翻訳が年々素晴らしくなっているのは事実です。ここまで翻訳の精度が上がっているなら、海外展開をしたい、ローカライズをしたい、翻訳を依頼したい、ときにわざわざ人に頼む必要はあるのでしょうか。
この記事では、人間翻訳と機械翻訳の違いを見ていきたいと思います。機械翻訳の仕組みはどうなっているのか、どんな利点・欠点が両者にあるのか、どのようにお互いの欠点を補えるのか、を確認しどのような翻訳の使い方がベストか見ていきましょう。

 

2. 意外と知らない機械翻訳の進化と今

機械翻訳が初めて発表されたのは1950年代で、今のGoogle翻訳の原型となった統計機械翻訳により飛躍的に機械翻訳の精度が向上したのは1990年代です。そして今、機械翻訳がニューラルネットワークというアルゴリズムを用い、「人間翻訳に勝てるのでは」という期待が人々の中で膨らんでいます。
機械翻訳と呼ばれているものにも何種類か存在します。その種類と特徴を簡単に見ていきましょう。

 

ルールベース機械翻訳   Rule-Based Machine Translation (RBMT)

イメージは、人が外国語を学ぶ時と同じプロセスを機械にもさせる、というものです。
用語集とルール(文法)を蓄積し、そのデータを使って翻訳がなされるので、例えば登録されていないルールを含む文章は訳せなくなってしまいます。文法に従うので、訳の正確さは高く意味は通じるかもしれないが、訳文はいわゆる直訳に近いものになってしまい、機械的で不自然になってしまいます。契約書や法的文書の翻訳には適しているかもしれません。

 

統計的機械翻訳 Statistical Machine Translation (SMT)

コーパスと呼ばれる膨大な訳文データを参照して、訳を産出します
データが多ければ多いほどアウトプットの翻訳が良くなり、少なければ訳は低質なものになってしまいます。英語みたいに世界中でかなり使われている言語の場合だとデータは多く翻訳の出来は良いかもしれません。しかし、例えばサーミ語(フィンランドの北部で話されている言語)のような訳文データ自体が少ないと同じ結果は期待できないでしょう。この翻訳だと直訳的で堅い翻訳は、ルールベース機械翻訳と比較して、少なくなります

 

 

ニューラル機械翻訳 Neural Machine Translation(NMT)

‘neural’とは「神経の」という意味で、人間の脳神経細胞に似た仕組みのプログラムを活用した機械翻訳です
Googleが現在使っているのはこの種類で、これは上でも述べたように統計機械翻訳の進化ヴァージョンです。日⇆英の対応は2016年に利用可能となりました。
統計翻訳と同じく膨大な対訳データを参照して訳文を産出していきますが、大きく異なるところがこのアルゴリズムは接頭辞(英語で言うと否定を示す’in, dis, de’や、繰り返し・再帰を示す’re’など)や語幹、単語の配置を分析するそうです。つまり単語やフレーズだけ考慮するのではなく、もっと広い範囲を見て細かい部分に反映させるのだそうです。

例えば、’Kanye West is going to run for President.’のように’run’には沢山の意味がありますが、’president’という単語もデータとして考慮して訳を算出します。性能がかなりアップしていて、産出される訳もより正確に、より自然になっています。その上、人工知能を使い訳文を収集してより良い翻訳のために学習するとのことです。

それでもやはり欠点はあります。ニューラル機械翻訳特有のマイナス点は…

・訳し過ぎる(原文にない内容が訳文で現れる)
・訳文が急に抜けることがある
・誤訳が急に発生する
・訳語が統一されない(同じ単語にも違う訳語が当てられる)

訳文の自然さという面で格段に精度は改良されましたが、上記の欠点を見ると翻訳したものを確認なしに公表するのは難しそうです。

 

3. 機械翻訳が得意な3つのこと

機械翻訳の進化と種類、そして精度の向上を確認しました。では人と比べてどんな素敵な点があるのでしょうか。

①スピードが速い フリーランスの翻訳家が、例えば英語の文章を日本語にする際に一日1500語〜2000語の翻訳が可能だという目安にしましょう。一日の作業時間を8時間とすると、この8時間分をGoogle翻訳だと瞬時にこなしてしまいます

②価格が安い クラウドソーシングの翻訳サービスでも英語から日本語だと一文字4、5円です。2000文字の英語文章を一文字5円で計算しても10,000円かかってしまいます。Google翻訳だと文章さえ入力してしまえば、無料で翻訳が実行されます。

③利用できる言語が多い Google 翻訳は対応言語が100言語を超えています。オンライン人口のほぼ全体です。これほど対応言語の多くて、人が行う翻訳サービスは存在しないでしょう

 

4. 人間も素晴らしい!

そんなに速くできるなら、そんなに安くできるなら、そんなに対応言語が多いなら、人は必要なのでしょうか?
こんなに利点が多い、さらに機械翻訳で性能が高くなっていたら、すぐさま機械翻訳に目を向けたくなるのは当然です。

ですが、人間翻訳には人間翻訳特有の、機械が敵わない得意技もあるのです。
機械が苦手で人間が得意なことというのは…
「テキスト以外のことも考慮にすることができる」ことです。

 

A: 背景を考える

翻訳を人が行うと文章の背景を考えることができます。
直訳してもどうしても意味が通じない場合があります。そんな時は翻訳者だと、その背景を考えて読者にわかりやすいような訳を、もしくは翻訳ではない適切な文章を、頭を捻って作り出すことができます。

例えば、映画のタイトルもそうです。
多くの場合は直訳してしまうと上手く作品の内容・雰囲気が伝わりません。
Pixar作品の中で『Up』という映画があります。原題を聞くとピンとこない人も多いかもしれません。このタイトルをそのまま訳してしまうと『上へ』『昇って』となってしまい、イメージが湧かずに観客は興味を持ちにくいかもしれません。
邦題として採用されたのは『カールおじさんと空飛ぶ家』です。訳者は実際の映像を見て内容を考えた上で、日本のオーディエンスに馴染みやすい思い切った訳をしました。わかりやすいですよね。これは正確にいうと翻訳とは呼べないかもしれませんが、素晴らしい転換で機械翻訳にはできない技です。

 

B: 読者を考える

機械だと誰がその翻訳を見るかなど、読者層や読者の心を考えてくれません。
例えば、より多くの人に使ってもらうためにソフトウェアの仕様を翻訳したい。しかし、その仕様自体は専門的でない人のために書かれていますが、それでも自分の国の平均的ITリテラシーを考えると少し使っている用語が難しすぎる。より簡単に仕様説明を訳したい…機械翻訳にそれができるでしょうか。

もう一つ例を挙げると、人間技は広告宣伝の際には特に大切になってきます。
有名な某スポーツメーカーのスローガン“Just do it”。 これはイメージとしては、「頭ばっかりで考えずに行動してみよ」みたいなアスリート精神を鼓舞するニュアンスで考えられたのでしょうが、機械翻訳だと「早くやれよ」と訳してしまいます。実際、日常的に使われる場合、このフレーズは「つべこべ言わずに早くやれよ」「さっさとしてよ」というニュアンスがあります。
機械翻訳はもちろん正しいですが、意図したメッセージとは大きくズレてしまいますよね。購買意欲を高めるものではなくなってしまいます。翻訳家だと一捻り加え「やるしかない」「考えるな、動け」「止まるな」(筆者訳)と顧客が好む訳を選択することができます。(ちなみにこのスローガンは公式な訳がないのでしょうか。「あえて訳さない」というのも人ができる一つの意識的選択だと思います。)

このような読者・読者の心理を考えた翻訳は機械翻訳にはできません。もし商品説明で人々の心を引くような表現にしたい、または広告を見るある特定の人々をターゲットにしたいなど、対象者を考えた訳が必要な場合は翻訳家に頼んだ方がいいでしょう。

 

C: 言葉を考える

テキスト以外の話をしてきましたが、機械翻訳もテキスト全ての対応ができるわけだはありません。
造語やスラング、言い回し、ことわざやギャグなどは、翻訳家でも簡単に翻訳できません。人間だったら文脈をみたり、リサーチをしたりして、適切な翻訳を見つける、もしくは斬新な考えで解決策を探すことさえできるのです。

例えば、同僚のアメリカ人英語講師に教えてもらった英語のダジャレがあります。

“Why does 6 fear 7?  Because 789(seven eight nine) → 7 ate 9. “
「なんで六は七のことを怖がっているの? 七が九を食べちゃったから。」(直訳)

この訳だと、何がダジャレになっているか全くわかりません。これを人が工夫して訳すと「なぜ六は七を避けているの? しちめんどくさいから。」(筆者訳)とする事もできます。
何とか原文のことも考えて、少しでもダジャレの要素を入れながら、訳せたのではないでしょうか?人間は二つの言語を考えて、言葉遊びや辞書にない単語でも、頭を捻り工夫して訳を産出してくれます。

 

D:その他

事務的な利点もあります。例えば、新聞には文字数に上限があるそうです。また字幕にもシーンのカット部分を考え一カットに出せる文字数が制限されているし、見やすいように漢字ばかり使うのを避けるといった文字の配列も考えなくてはなりません。そのような事務的な制限や条件に柔軟に対応できるのも翻訳家です。

 

5. まとめ

機械翻訳の特徴、人間翻訳の特徴、両者を見て結論づけられるのは…
コンボで最強!
ということです。

簡単に利点欠点をみてまとめると、機械翻訳は「安くて速く扱い易い」が不正確です。訳文自体が不自然な事もあれば、訳が急に抜けてしまうことがあります。それに対して人間翻訳は「値段が高くて遅い」と不便であるが訳の正確性や柔軟性がいいので様々な原文に対応することができます。

 

 

機械翻訳

安い、速い、多い言語

  • 不自然な表現 (訳が堅くより直訳っぽい)
  • 訳文が急に抜けることがある
  • 誤訳が急に発生する
  • 訳語が統一されない

 

人間翻訳

高い、遅い、少ない言語

  • より自然な表現(テキスト以外の要素も考える)
  • 訳が抜けることはない
  • 誤訳の発生率はかなり少ない
  • 訳語は統一される

 

これらをみるとお互いの欠点を綺麗に補っているのが分かりますよね。
機械翻訳が優れている訳でもなく、単純に片方が良いわけでもありません。このお互いの利点・欠点を利用すると…

機械翻訳でざっと全体を訳し、気になるところのポストエディットを人間が行う

というのがより多くの人が利用しやすく、両者を最大限に活かせる方法ではないでしょうか。ポストエディットとは、機械翻訳で産出された訳文を人間がチェック・編集する処理のことを言います。もちろん予算や要望に応じて両者の活用を柔軟に変更することができますが、このコンボが低予算でなるべく速く、そして正確に翻訳を実施できる手段でしょう。
翻訳をする者として将来への不安を吐露しましたが、翻訳家の中には機械翻訳のおかげで扱いやすくなるテキストが増えたことにより、仕事が増えると考えている人もいるようです。
ローカライズ・多言語化のプロセスをより円滑にするには、要望や目的に応じて機械翻訳と人間翻訳を使い分けたり、さらに二つを組み合わせることで効率良く・円滑に翻訳をすることができる、と結論づけることができるでしょう。

 

<筆者プロフィール>
ペンネーム: Donté Taka(ダンテ・タカ)
生まれも育ちも大阪、東京在住
Hip-hop好き、文学好き、映画好き
英語教えてて、翻訳してて、書いてます。
最近見てめっちゃよかった映画は
‘Romeo is bleeding’。ドキュメンタリーです。

 

参照:
https://nilservices.com/machine-translation-vs-human-translation/
http://gotcha.alc.co.jp/entry/20161227-it-translator
http://gotcha.alc.co.jp/entry/20161220-it-translation
http://eikaiwa.dmm.com/blog/39301/
http://accutranslate.co.uk/blog/machine-translation-should-you-use-it-for-ecommerce

翻訳・多言語化の決定版
WOVN.io

最短5分であなたのウェブサイトを翻訳・多言語化対応!!