« CMU のトップページにて、研究内容が紹介されました | メイン | ビルゲイツ来校&ピッツバーグ金融サミット »

English Central という英語学習サイトがすごい

留学する前にこのサイトに出会いたかった、というようなすごい英語学習サイトを見つけました。一言でいうと、英語の字幕を読んで録音すると、発音を音声認識して自動採点してくれるというサイトです。デモでスティーブジョブズのスピーチがあったので、試してみました。スクリーンショット(クリックで拡大)↓

english_central1

点数が悪かった文(画面下)は黄色く表示されるのでクリックしてみると、今度は単語レベルで悪かったところがわかります。"truely"が黄色くなっており、この単語の発音がだめだったことがわかります。で、"truely"をクリックすると・・・

english_central2

「truely の L が R になっていますよ」という音節レベルでの指導までしてくれます。しかもお手本と録音の単語レベルでの聞き比べも可能。

元の動画をスローで再生することもできるので、字幕を見なければディクテーションにも使えそうです。ディクテーションとシャドーウィングを両方いっぺんに自動採点、なんて便利なツールは今までになかったと思います。他にも点数のランキングなどもあって、英語学習を続けるモチベーションになるような機能が充実しています。

体験デモはこちらから。途中で動画が止まるというバグもありましたが、よくできてます。プレスリリースによると、10月15日まで無料体験ができるとか。オバマやイチローやビルゲイツやエリックシュミットなどいろいろな著名人の動画がそろっています。

個人的な経験から語ると、というか皆わかっていることなのかもしれませんが、日本の英語教育はオブラートに包んで言うと実用的に遠回りなものばかりです。CMU でも研究プロジェクトのある CALL (Computer-assisted language learning) という分野では、今回紹介したサイトのようなツールを開発しているようなのですが、そういうところからも便利で無料のツールがどんどん出てきて、将来的に日本の英語教育を変えていってほしいと思います。

【参考】

(追記)思いっきり日本人発音で録音しても、アクセントをめちゃくちゃにしても、雰囲気だけで結構適当にしゃべっても高得点が取れました・・・。確かにこういうサイトでは甘い採点のほうがユーザを飽きさせず、良いのかもしれません。技術的な面を考えると、いわゆる音声認識ソフト/タスクと違って、ブラウザ上で計算しなくてはいけない(言語&音響モデルがメモリに乗らない、計算が遅い。サーバサイドで計算しても音声データの転送がかなりのボトルネック)という制約と、話者による音響モデルの訓練を避けたい(ユーザにとって敷居が上がるから)点があるので、早くて精度のいい認識をするのはかなりチャレンジングなはずです。ただ、字幕という正解がわかっているので、アライメントするだけでほどよく動くものが作れるというアドバンテージもあって、ビジネス化できるほどの製品ができたのかもしれません。採点精度はともかく、単語の聞き比べはすごく役に立つと思いますので、試してみて損はないと思います。

(追記2)アクセスが集中している時、"Unable to get connection to recognizer"というエラーメッセージが出てきました。RTMPプロトコルでストリーミングしてサーバサイドで計算してるみたいです。スレッド間でモデルを共有すればある程度スケールしそうですし、確かにそのほうがいい実装かも。ちなみに Kai-fu Lee の動画も教材として使えるのですが、彼が CMU の助教授だったとき、音声認識に隠れマルコフモデルをはじめて応用してイノベーションを起こしたそうです。その後、Apple VP→SGI VP→Microsoft VP(MSR China 立ち上げ)→Google VP(Google 中国社長)と華麗な経歴を経て、最近VCを起業することを発表し、話題になりました。

トラックバック

このエントリーのトラックバックURL:
http://w-it.sakura.ne.jp/mt/mt-tb.cgi/649

コメントを投稿

(いままで、ここでコメントしたことがないときは、コメントを表示する前にこのブログのオーナーの承認が必要になることがあります。承認されるまではコメントは表示されません。そのときはしばらく待ってください。)