IT is IT.

空想イノベーション

統計的自然言語処理による翻訳精度の向上

f:id:itry:20190119102643p:plain
統計的自然言語処理とはインターネットの普及により、多くのWebページ上の文字を扱う研究の始まりによって発展した処理である。
従来の翻訳は、個々の単語単位を文脈の一部として、そのままに訳すことしかできなったため、例えば「Window」を、PC画面の「ウィンドウ」ではなく「窓」と訳されたりしていた。

統計的自然言語処理では、複数の単語をひとまとまりにすることで、多数の対訳データ(コーパス)を元に、より正確な翻訳ができるようになった。

スポンサーリンク
 


「bank」という単語には

  • 銀行
  • 土手

という全く異なる意味がある。
これを

  • I have money in the bank.

「money」や「in」というコーパスが近くにあれば「銀行」と訳される。

  • Flowers are blooming on the bank.

「flower」や「on」というコーパスが近くにあれば「土手」と訳される。

こういったことを機械学習による統計的自然言語処理で、翻訳の精度が日々向上している。