統計的自然言語処理による翻訳精度の向上
統計的自然言語処理とはインターネットの普及により、多くのWebページ上の文字を扱う研究の始まりによって発展した処理である。
従来の翻訳は、個々の単語単位を文脈の一部として、そのままに訳すことしかできなったため、例えば「Window」を、PC画面の「ウィンドウ」ではなく「窓」と訳されたりしていた。
統計的自然言語処理では、複数の単語をひとまとまりにすることで、多数の対訳データ(コーパス)を元に、より正確な翻訳ができるようになった。
スポンサーリンク
例
「bank」という単語には
- 銀行
- 土手
という全く異なる意味がある。
これを
- I have money in the bank.
「money」や「in」というコーパスが近くにあれば「銀行」と訳される。
- Flowers are blooming on the bank.
「flower」や「on」というコーパスが近くにあれば「土手」と訳される。
こういったことを機械学習による統計的自然言語処理で、翻訳の精度が日々向上している。