ブログトップ | ログイン
ドラゴンスピーチ11で『吾輩は猫である』を音声入力して遊んでみる
c0060143_23393420.jpg

NUANCEさん主催の、『ドラゴンスピーチ11』のブロガーイベントに参加して、この音声入力ソフトをいただいたので、さっそくインストールして使ってみました。

ちなみに、マイク付きのヘッドセットがソフトに同梱されています。
インストールして、音声デバイスの音量チェックと音質チェックを行った後、音声のクセを認識させるためのトレーニングを行いました。

で、音声入力で少し遊んだ後、おもむろに夏目漱石先生の小説『吾輩は猫である』を音声入力。その違いと精度を比較してみましょう。

まず、原文はこちら。

吾輩は猫である。名前はまだ無い。
どこで生れたか頓と見當がつかぬ。何でも薄暗いじめじめした所でニヤーニヤー泣いて居た事丈は記憶して居る。吾輩はこゝで始めて人間といふものを見た。然もあとで聞くとそれは書生といふ人間中で一番獰悪な種族であつたさうだ。此書生といふのは時々我々を捕へて煮て食ふといふ話である。然し其當時は何といふ考もなかつたから別段恐しいとも思はなかつた。但彼の掌に載せられてスーと持ち上げられた時何だかフハフハした感じが有つた許りである。掌の上で少し落ち付いて書生の顔を見たのが所謂人間といふものゝ見始であらう。此時妙なものだと思つた感じが今でも殘つて居る。第一毛を以て装飾されべき筈の顔がつるつるして丸で薬罐だ。其後猫にも大分逢つたがこんな片輪には一度も出會はした事がない。加之顔の眞中が餘りに突起して居る。そうして其穴の中から時々ぷうぷうと烟を吹く。どうも咽せぽくて實に弱つた。是が人間の飲む烟草といふものである事は漸く此頃知つた。


で、じっさいに上記の文章を声に出して読んで、音声認識でテキスト化したのがこちら。

吾輩は猫である。名前はまだない。
どこで生まれたかとんと見当がつかない。なんでも薄暗いじめじめした所でニャーニャー泣いていた事だけは記憶している。吾輩はここで初めて人間というものを見た。しかもあとで聞くとそれは初世と言う人間中で1番当惑な種族であったそうだ。この書生というのは時々我々をつかまえて煮て食うと言う話である。しかしその当時は何と言う考えもなかったから別段恐ろしいとも思わなかった。ただ彼の手のひらに乗せられてすーっと持ち上げられた時なんだかふわふわした感じがあったばかりである。手のひらの上で少し落ち着いて書生の顔を見たのがいわゆる人間というものの見始めであろう。この時妙なものだと思った感じが今でも残っている。第一形をもって装飾されるべきはずの顔がツルツルしてまるでやかんだ。その後猫にもだいぶあったがこんな型番には1度も出くわしたことがない。のみならず顔の真ん中があまりに突起している。そうしてその穴の中から時々ぷうぷうっと煙を吹く。どうも夢精ぽくて実に終わった。これが人間の飲むタバコと言うものである事はようやくこの頃知った。


滑舌良く、はっきりとしゃべるのがコツ。句読点の「。」は「まる」と、改行も「かいぎょう」と声に出して発音します。
思った以上の精度でびっくり。結構なめらかに変換されます。
ただし、古い言葉づかいは新しい言葉に変換されますね。

「見當がつかぬ」は「見当がつかない」となっています。
書生が最初は「初世」と変換されましたが、2回目はきちんと「書生」になってますね。
「但彼の掌に載せられてスーと持ち上げられた時」っていう表現も「ただ彼の手のひらに乗せられてすーっと持ち上げられた時」っていう表記になってて、音声認識テキストの方が現代語として分かりやすいです。
一点、「どうも咽せぽくて實に弱つた」っていう箇所が、「どうも夢精ぽくて実に終わった」ってなってて、「いやいやいや、僕、夢精なんて言ってないですから」と、ちょっと恥ずかしいことに。さすがに、文章の流れをみて、その単語がふさわしいかどうかまでは判断付かないですよね。いやはや。

「烟草」が「タバコ」になってたりとか、「薬罐」が「やかん」とか、音声認識の方が平易な単語。「片輪」っていう表現が「型番」になってるのも、なんか面白いなぁと思いました。

一度、ゴリゴリの旧仮名遣いの古い小説をまるまる一冊音声認識でテキスト化してみたら面白いかもしれない。

それにしても、音声認識&入力って、すげぇなぁと思った体験でした。
今度、音声認識でブログをまるっと書いてみたら面白いかも。

Fans:Fans

by t0maki | 2014-06-15 23:38 | ブロガーイベント | Comments(0)

<< チェリオ初、本気のエナジードリ...     散歩帰りに娘がCanon「Po... >>
Back to Top