2008年05月20日

googleでフィンランド語日本語間の機械翻訳

 5月15日付でGoogle翻訳にフィンランド語を含む10言語(ブルガリア語 クロアチア語 チェコ語 デンマーク語 ヒンディー語 ノルウェー語 ポーランド語 ルーマニア語 スウェーデン語の)の翻訳機能が追加されたそうです。

Google Translate adds 10 new languages
The newly featured languages include Finnish

 試しにフィンランドの新聞Helsingin Sanomatなんかを日本語に翻訳させてみましたが、意味不明な翻訳になってしまいました。残念。ちなみにこれ、英語寄りな中間言語方式なのかフィンランド語→英語だとまだ若干はマシなように思える。
 だけどHelsingin Sanomatの記者が「Googleの翻訳機能はおかしい」って記事を書いてるくらいだし、やっぱおかしいんだろうな。

Google soomentaa vähän miten sattuu
Lauseen "Käännä tämä suomeksi" käännös on "Translate this psychiatry". Jos lauseen alkukirjaimen vaihtaa pieneksi, tulos on "translate it in English".

 この記事も微妙でsoomentaaはsuomentaaをgoogleにかけて伸ばしてるんだかなんだか、ググってもsoomentaaなんて出てこない。で、上の記事だと「"Käännä tämä suomeksi"は簡潔に訳すと(ググるさんのおかしな翻訳とは違い)"translate it in English"になる」とか書いてるけど、これって"translate it in Finnish"じゃないのかな・・・。

 日本語のサイトをフィンランド語に翻訳する方は試しに自分のブログを翻訳させてみたところ、文によっては伝わるものも多いかな?という雰囲気でした。

 ところでこの翻訳システムの仕組みについて記述。

統計的機械翻訳とは
今日市場に出回っている自動翻訳システムのほとんどは、規則ベースで開発されており、語彙や文法の定義など多くの作業を必要とします。

Google の翻訳システムの手法は異なり、ターゲットとなる言語で記述された単一言語のテキストと、人間が翻訳した他言語のサンプル翻訳テキストを対にしたものを大量にコンピュータに入れます。そしてこれらのテキストに統計的学習手法を適用して、翻訳モデルを構築しています。Google のリサーチ評価では、この手法が優れた結果をもたらすことが判明しています。

 ということで、フィンランド語←→他言語の翻訳サンプルが不足しているのではないかとも考えられます。まあ仕方がないか。

 Googleは日本語検索語句の揺らぎを吸収する機能なんかがかなり優れていていい感じなんですが、フィンランド語で検索する場合は少しの語形の変化でも全く別の検索結果を返してくるようです。そもそもフィンランド語自体を軽視しているのではないか、という感じはします。

Michitomo - 2008年05月20日 0時10分 | コメント1匹 | トラックバック0羽 | その他・未分類
この記事は | | | |
この記事へのコメント
感想さん - 2016年06月28日 21時58分
コメントを書く
お名前:

コメント:


この記事へのトラックバック
×

この広告は180日以上新しい記事の投稿がないブログに表示されております。