こんな基本的な文もまともに翻訳できないとは!
こんな翻訳品質で「統計的翻訳システム」とか言って表に出ているなんて…。
ということで、「Google翻訳が面白すぎる件 (Cozy Ozy)」(http://d.hatena.ne.jp/Ozy/20080916) よりいくつかピックアップしてみました(Excite 翻訳との比較表)。
学生が夏休みに作るプロトタイプじゃないんだから。
いかにベータ版といえども最低限度の品質は保ってもらわないと、まじめに英日機械翻訳やっている人に迷惑。
統計とか機械学習とかそういうのやっている人に迷惑。
「機械翻訳」を名乗るのはもうちょっと質が上がってからにしてくれ。
と思ったけど、むしろ、逆に「Google がやるんだから」と過度に期待をかけすぎる人たちの方が迷惑かも[2007-03-29-2]。
「Google でさえこのくらいなんだから機械翻訳ってぜんぜん使えないねー」と世間に思われちゃったりする状況を引き起こすからね。
と、Google 翻訳の質の悪さを始めて知ったかのようにコメントしてみちゃったりして。
Google の機械翻訳チームには、今後もがんばって研究・開発を続けていって欲しいけど、その言語に対してネイティブかネイティブに近いスタッフをつけて欲しいところ。
そういうところをけちっちゃ一番ダメなんだけど、いかに人手をかけないようにシステムをまわすかがポイントの会社だからな(良くも悪くも)。
まあ、一言で言うと、
「日本語やるならちゃんと日本語分かる人をつけてね!」
ということ。
早く使える日英間統計翻訳が登場するといいなあ。
がんばれ Google!!!
機械翻訳について興味のある人は、id:nofrills さんのブログ記事が参考になります。
このように継続して調べ続けて、それをブログで公開し続ける人がいるというのは非常にありがたいことです。
日本にとって。日本語にとって。
- これで翻訳と名乗れるその神経がわかりません、Googleさん。
http://d.hatena.ne.jp/nofrills/20080904/p1
-- 「役に立たない」をusefulと「翻訳」するGoogle翻訳の件、補足。
http://d.hatena.ne.jp/nofrills/20080905/p2
- 英→日、「使える」無料翻訳はどれか~2008年9月版
http://d.hatena.ne.jp/nofrills/20080908/p2
- 米Microsoft、自社開発の機械翻訳サービスを試してみたが
http://d.hatena.ne.jp/nofrills/20080909/p2
だってさあ、日本語がまったく分からない人が、外国語がまったく分からない日本人に、Google翻訳で訳した文をメールしてきたらうんざりでしょ?
向こうは、ちゃんとした日本語になっていると思ってるんだから。
追記080918:
- Google翻訳 (日・英) は、まだBETAにもならない実験段階だと思う。
http://d.hatena.ne.jp/nofrills/20080917/p2
追記110516: かなり良くなって来た!
- [O] Google 翻訳の英日翻訳の品質について 2011 年版
http://diary.overlasting.net/2011-05-12-1.html
- [を] Googleの統計的機械翻訳[2007-03-29-2]
- [を] RSS を読み込んでランダムな文章を生成する[2008-09-07-3]
(まあ、生成された日本語文をみると、こういうのと大差ないかも(言いすぎ?))
- ATLAS 翻訳スタンダード V14.0
(Excite 翻訳のエンジン)
こんな翻訳品質で「統計的翻訳システム」とか言って表に出ているなんて…。
ということで、「Google翻訳が面白すぎる件 (Cozy Ozy)」(http://d.hatena.ne.jp/Ozy/20080916) よりいくつかピックアップしてみました(Excite 翻訳との比較表)。
Read after me. | |
---|---|
読み取り後、私です。 | |
Excite | 私の後に読んでください。 |
I forgot to call her last night. | |
パスワードを忘れて彼女の最後の夜をコールします。 | |
Excite | 私は、昨夜彼女に電話をするのを忘れました。 |
She doesn't know how to play golf. | |
彼女はゴルフをする方法を知っています。 | |
Excite | 彼女はゴルフをする方法を知りません。 |
She bought a picture painted by a famous painter. | |
彼女は買って画像塗装された有名な画家です。 | |
Excite | 彼女は有名な画家によって描かれた絵を買いました。 |
She went out to look for a taxi. | |
彼女がお留守にタクシーを探しています。 | |
Excite | 彼女はタクシーを探しに外へ出ました。 |
これはひどい
学生が夏休みに作るプロトタイプじゃないんだから。
いかにベータ版といえども最低限度の品質は保ってもらわないと、まじめに英日機械翻訳やっている人に迷惑。
統計とか機械学習とかそういうのやっている人に迷惑。
「機械翻訳」を名乗るのはもうちょっと質が上がってからにしてくれ。
と思ったけど、むしろ、逆に「Google がやるんだから」と過度に期待をかけすぎる人たちの方が迷惑かも[2007-03-29-2]。
「Google でさえこのくらいなんだから機械翻訳ってぜんぜん使えないねー」と世間に思われちゃったりする状況を引き起こすからね。
と、Google 翻訳の質の悪さを始めて知ったかのようにコメントしてみちゃったりして。
でも、がんばれー!
Google の機械翻訳チームには、今後もがんばって研究・開発を続けていって欲しいけど、その言語に対してネイティブかネイティブに近いスタッフをつけて欲しいところ。
そういうところをけちっちゃ一番ダメなんだけど、いかに人手をかけないようにシステムをまわすかがポイントの会社だからな(良くも悪くも)。
まあ、一言で言うと、
「日本語やるならちゃんと日本語分かる人をつけてね!」
ということ。
早く使える日英間統計翻訳が登場するといいなあ。
がんばれ Google!!!
参考になるブログ
機械翻訳について興味のある人は、id:nofrills さんのブログ記事が参考になります。
このように継続して調べ続けて、それをブログで公開し続ける人がいるというのは非常にありがたいことです。
日本にとって。日本語にとって。
- これで翻訳と名乗れるその神経がわかりません、Googleさん。
http://d.hatena.ne.jp/nofrills/20080904/p1
-- 「役に立たない」をusefulと「翻訳」するGoogle翻訳の件、補足。
http://d.hatena.ne.jp/nofrills/20080905/p2
- 英→日、「使える」無料翻訳はどれか~2008年9月版
http://d.hatena.ne.jp/nofrills/20080908/p2
- 米Microsoft、自社開発の機械翻訳サービスを試してみたが
http://d.hatena.ne.jp/nofrills/20080909/p2
このようなことを書いているからといって、機械翻訳の研究開発を否定したり、ちょっと長めの引用(改行入れました)になってしまいましたが、上記の意見には全面賛成です。
それを冷笑的に見たりしているわけではない、ということはご理解ください。
これらのツールが一般人に「使える」ものとはいえない段階にある、
というのが前提です。
どこかで「Google翻訳は便利だよ」と書かれていれば、
譬えそれがGoogleという私企業のセールストークであったとしても、
それで「翻訳」された結果は「正しい」と思って
そのまま使ってしまう人がいても当然で、
そういう技術が簡単に利用できるようになっていれば(APIなども含めて)
人々がそれを利用するのも当然で、
実際にそういう「(実は意味不明の)翻訳文」が、
(スパムなどではなく)真面目にコミュニケーションしようという
意図のもとで用いられているのを見ては、「ああ、それはだめ」と思うこともあり
(そしてわけのわからない反撃にあって粘着されたりしたこともありますが)……。
私が言いたいのは、研究開発が悪いとかいうことではありません。
ただし、エンドユーザーにとって「使える」かどうかは、それとはまったく別のことです。
だってさあ、日本語がまったく分からない人が、外国語がまったく分からない日本人に、Google翻訳で訳した文をメールしてきたらうんざりでしょ?
向こうは、ちゃんとした日本語になっていると思ってるんだから。
追記080918:
- Google翻訳 (日・英) は、まだBETAにもならない実験段階だと思う。
http://d.hatena.ne.jp/nofrills/20080917/p2
追記110516: かなり良くなって来た!
- [O] Google 翻訳の英日翻訳の品質について 2011 年版
http://diary.overlasting.net/2011-05-12-1.html
関連リンク
- [を] Googleの統計的機械翻訳[2007-03-29-2]
何かしらブレイクスルーが必要なんだけど、この記事を読む限りは、(予想的中。しかし忍耐強く待ちますよ!がんばれ!)
今のGoogleの機械翻訳プロジェクトは
日本語にしっかり取り組む体制じゃないみたいだから当面は期待薄。
- [を] RSS を読み込んでランダムな文章を生成する[2008-09-07-3]
(まあ、生成された日本語文をみると、こういうのと大差ないかも(言いすぎ?))
- ATLAS 翻訳スタンダード V14.0
(Excite 翻訳のエンジン)
この記事に言及しているこのブログ内の記事