IT is IT.

空想イノベーション

統計的自然言語処理による翻訳精度の向上

AI 人工知能をめぐる動向

f:id:itry:20190119102643p:plain
統計的自然言語処理とはインターネットの普及により、多くのWebページ上の文字を扱う研究の始まりによって発展した処理である。
従来の翻訳は、個々の単語単位を文脈の一部として、そのままに訳すことしかできなったため、例えば「Window」を、PC画面の「ウィンドウ」ではなく「窓」と訳されたりしていた。

統計的自然言語処理では、複数の単語をひとまとまりにすることで、多数の対訳データ（コーパス）を元に、より正確な翻訳ができるようになった。

スポンサーリンク

例
「bank」という単語には

銀行
土手

という全く異なる意味がある。
これを

I have money in the bank.

「money」や「in」というコーパスが近くにあれば「銀行」と訳される。

Flowers are blooming on the bank.

「flower」や「on」というコーパスが近くにあれば「土手」と訳される。

こういったことを機械学習による統計的自然言語処理で、翻訳の精度が日々向上している。