音声認識とタブレットPCの記事に対する雑感

http://www.itmedia.co.jp/bizid/articles/0712/20/news121.html

常々思っているが、音声認識ユーザの意見がネット上に出てくる機会はほとんどないだけにこういう記事の存在は貴重。
「昔ダメだったけど今は工夫すれば意外と使えるじゃん」って意見は音声研究者に取っては励みになることだろう。

自分も過去、実験も兼ねてスピーチブログと称して音声認識でブログを付けることにチャレンジしたことがある。*1
http://d.hatena.ne.jp/shibacho/searchdiary?word=%2a%5b%a5%b9%a5%d4%a1%bc%a5%c1%a5%d6%a5%ed%a5%b0%5d

でも、結構面倒くさくて文字通り3日坊主になった。
理由としては、音声認識率の問題もあるんだけど、他にもいくつか問題がある。

まず、しゃべってblogを書くというのが便利そうなんだけど、これが意外と難しい。
普段の自分のblogの書き方のスタイルとして、キーボードを打ちながら考えながら、という感じで書いているので、言うことが決まってないうちから音声を発するというのが意外に難しい。これは音声認識器エンジンがなくてもやってみれば実感できるのではないかと思う。

だから、上記の記事の

発声することで、自分の考えがまとまることもある。行き詰ってしまったときにも効果がありそうだ。

というのは驚きだった。多分、書く文章のジャンルやスタイル、使おうとする人の世代や性格*2や職業、といった細かな違いでここら辺の感想は変わるのだろう*3

そういう意味では、Web2.0のこのご時世、とにかく色んな人に音声認識を試して欲しいと思うところだが、
はてブの意見にもあるように初期投資がかかるというのは確かに大きな欠点ではある。

とにかく安い音声認識エンジンを、という意味ではソースネクストから出ているパッケージが安い。

ドラゴンスピーチ・パートナー 2005

ドラゴンスピーチ・パートナー 2005

高めではあるが、最近出た(これ系のソフトで)唯一Windows Vista対応をうたっているのはAmivoice es 2008

AmiVoice Es 2008 USBマイク同梱版

AmiVoice Es 2008 USBマイク同梱版

なんとかフリーソフトで、という人には音声認識エンジンのJuliusってソフトやWebで出来るw3voiceがあるので試してみると良いだろう。
http://julius.sourceforge.jp/
http://w3voice.jp/
ただ、JuliusはWin用フロントエンドがないので、ちょっと試したいって人には敷居が高いかもしれない。
オフィシャルページの説明も研究者向きなので、使い方も難しいかもしれない。

ま、はてなを見ている人はキーボード打つの早い人が多いので、使ってみて「やっぱダメじゃん」って意見が多いかもしれないけど
これを見て一人でもトライしてみようと思う人がいてくれたらうれしい。

続きのエントリを見る>音声認識に興味津々なGeekとパソコンスキル

*1:今見たら音声無くなってた、そのうちあげ直すかも

*2:著者は61歳

*3:あくまで予感ですけど