2019/7/16更新
最近のAIと呼んでいるディープラーニングというアルゴリズムを使った手法により自動翻訳の精度が上がっている。しかし、自動翻訳についてはテキスト翻訳と音声翻訳に分けて考える必要があるように思う。
ポケトーク等の音声翻訳が分野を限定すれば実用レベルに近い水準に近付いているように私は思っているが、一方でテキスト翻訳のレベルは実用にはまだほど遠いように思う。グーグル翻訳でもネーティブスピーカーレベルの語学力までは達していない人が時間を節約するために参考程度に使用できる水準にすぎないと思う。
会話程度の音声翻訳なら比較的短いセンテンスを対象にすればいいので話者の音声に近いデータをデータベースから探せれば精度の高い翻訳結果が得られると推測できる。だから、できるだけ多くのデータをデータベースに蓄積することが翻訳精度の向上につながる。
「ディープラーニングではニューラルネットワークと呼ばれる人間の神経構造を模したアルゴリズムを発展させることで、特徴量を自動的に見つけ出せる」からデータの蓄積さえあれば、話者の音声に似た波形のデータをデータベースから取り出すのは技術的に容易になっている。
しかも、音声翻訳の場合、通常、会話者同士が同じ環境にいるので前後の脈絡は共有されており、言葉以外の視覚情報等も使って言葉の意味を推測できる。
一方、テキスト翻訳は音声翻訳より長いセンテンスを対象にしており、音声データのように特徴量を自動的に見つけ出すことは難しいように思う。
音声翻訳は分野(例えばレストランでの注文等)を限定できればより精度が上がるだろう。しかし、テキスト翻訳については分野を絞るだけでは精度を上げることは難しいように思う。なぜなら、前後の文脈を無視して翻訳することができないからだ。テキストの場合、前後の文脈等の意味的な解析なしに精度の高い翻訳を実現することが可能だとは思えない。
また、会話の場合のように音声以外の視覚情報等もなく、前後の脈絡等を機械に判断させるためには様々な情報がデータベースに蓄積されている必要がある。つまり、テキストの文字だけではなく、時代背景等の知識まで必要になる。同じ文字でも時代背景や状況に応じて言葉の意味は違ってくる。
一方、現在の音声翻訳は前後の文脈を考慮しなくても(現在、使われている音声翻訳にどの程度の意味的な解析が行われているかは知らないが)話者の発声した音の波形に近いデータをデータベースから発見できればかなり精度の高い翻訳ができるのではないだろうか。
そのことは翻訳機やスマホが極めて高い精度で音声認識をしていることからも想像できる。現実にスマホのマイクから拾った音声の認識率の高さには驚かされる。そして、データベースにその音声に対応する外国語の音声データが存在していれば翻訳はそれ程難しくないのではないだろうか。
逆説的に言えば、音声翻訳はテキスト翻訳に比べて意味的な解析に依存しなくてもある程度の精度の翻訳を実現できるので処理速度が速く、実用性の高い翻訳機を低コストで市場に提供できているのではないだろうか。
👉 Google翻訳アプリの翻訳精度を翻訳機ポケトークと比較 - トライ翻訳機
👉使ってみました!新型翻訳機「ポケトークW」を初代モデルと徹底比較
👉ポケトークW購入レビュー。実際に使ってみて感じたメリットと気になる点
そう考えると意味的な解析が必要とされるテキスト翻訳の翻訳精度が急激に上がる可能性はとても低いのではないかと私は考えている。
実際にこうした疑問を持った人たちがテキスト翻訳のレベルの検証をしている。その結果は予想通りと言えるものだ。
👉ウェブページ機械翻訳の精度が低い問題:自動翻訳の方法を検証してみた結果 - 事実を整える
👉テキスト自動翻訳・機械翻訳比較 (日本語・英語) | クラウドサービス徹底比較・徹底解説 (2019年版)
👉「Google」VS「エキサイト」VS「アルコム」VS「weblio」本当に使える翻訳サービスはどれ?検証してみた
Excelのヘルプの説明にも一部に機械翻訳が使われているが、日本語として、あるいは説明文として成立していないレベルのものを製品の説明文として提供していることに私は疑問を感じている。不完全な商品を売っても許されるというコンピューター業界の常識がベースにあるように思う。これは甘えであり、おごりだと思う。
分からな点をヘルプしてくれるのが本当のヘルプではないだろうか。機械が勝手に翻訳しているから間違っているかもしれませんという商売が他の業界で成り立つだろうか。要は人手を掛けたくないから分からなかったら英語の解説を読んでくれというのは殿様商売そのものだと思う。
英語ファーストについて私はムカついている。グローバル企業の市場独占が進むにつれて様々な分野の商品の多様性が失われつつあるように思う。彼らは進出した国の文化やニーズに合わせて商売をする努力を拒否して自分たちの製品が受け入れられない理由を何でもかんでも非関税障壁として政治を使って外圧をかけてくる。それがTPPであり、自由貿易協定だろう。
すべての国が英語圏になれば、翻訳ビジネスは不要になる。当然、自動翻訳は無用の長物になり、生産性が上がるのではないだろうか。しかし、そうはならないからナチュラルスピーカー優位の市場が形成されつつあるのではないだろうか。
日本での入札に英語が認められるならアメリカでの入札でも日本語での入札が認められるのが平等というものではないだろうか。ポチの国、日本。最近の本音主義者は、日本では狂犬だが、アメリカに対してはポチなのではないだろうか。こういうのを内弁慶というのではなかっただろうか。
テキスト翻訳が実用レベルになる日は、私は遠いと思っている。それは現在、バカの一つ覚えのように何でもAIで世の中が変わるという風潮がいずれ冷めることを意味している。技術を過信してはいけないことを福島の原発事故が証明してくれている。結局、人知などというものはたかが知れており、人間が経験で知り得た知識や技術はほんの一部にすぎない。そういう謙虚な気持ちが大切だと思う。 おしまい