5月15日付でGoogle翻訳にフィンランド語を含む10言語(ブルガリア語 クロアチア語 チェコ語 デンマーク語 ヒンディー語 ノルウェー語 ポーランド語 ルーマニア語 スウェーデン語の)の翻訳機能が追加されたそうです。
Google Translate adds 10 new languages
The newly featured languages include Finnish
試しにフィンランドの新聞Helsingin Sanomatなんかを日本語に翻訳させてみましたが、意味不明な翻訳になってしまいました。残念。ちなみにこれ、英語寄りな中間言語方式なのかフィンランド語→英語だとまだ若干はマシなように思える。
だけどHelsingin
Sanomatの記者が「Googleの翻訳機能はおかしい」って記事を書いてるくらいだし、やっぱおかしいんだろうな。
Google soomentaa vähän miten sattuu
Lauseen "Käännä tämä suomeksi" käännös on "Translate this psychiatry". Jos lauseen alkukirjaimen vaihtaa pieneksi, tulos on "translate it in English".
この記事も微妙でsoomentaaはsuomentaaをgoogleにかけて伸ばしてるんだかなんだか、ググってもsoomentaaなんて出てこない。で、上の記事だと「"Käännä tämä suomeksi"は簡潔に訳すと(ググるさんのおかしな翻訳とは違い)"translate it in English"になる」とか書いてるけど、これって"translate it in Finnish"じゃないのかな・・・。
日本語のサイトをフィンランド語に翻訳する方は試しに自分のブログを翻訳させてみたところ、文によっては伝わるものも多いかな?という雰囲気でした。
ところでこの翻訳システムの仕組みについて記述。
統計的機械翻訳とは
今日市場に出回っている自動翻訳システムのほとんどは、規則ベースで開発されており、語彙や文法の定義など多くの作業を必要とします。
Google の翻訳システムの手法は異なり、ターゲットとなる言語で記述された単一言語のテキストと、人間が翻訳した他言語のサンプル翻訳テキストを対にしたものを大量にコンピュータに入れます。そしてこれらのテキストに統計的学習手法を適用して、翻訳モデルを構築しています。Google のリサーチ評価では、この手法が優れた結果をもたらすことが判明しています。
ということで、フィンランド語←→他言語の翻訳サンプルが不足しているのではないかとも考えられます。まあ仕方がないか。
Googleは日本語検索語句の揺らぎを吸収する機能なんかがかなり優れていていい感じなんですが、フィンランド語で検索する場合は少しの語形の変化でも全く別の検索結果を返してくるようです。そもそもフィンランド語自体を軽視しているのではないか、という感じはします。