音声認識

裁判員制度に向けた、最高裁が開発させた音声認識システム

法廷のやりとりを文字化するシステムを最高裁がNECに開発させたらしい。 最高裁はNECに委託し、05年から約4億円をかけて開発した。実用段階では8割の認識率を目指すが、そのレベルに近づきつつあるという。実証試験を経て今年度中に、全国計約170…

ホッテントリメーカーで音声認識について書く

http://pha22.net/hotentry/ ■ 「音声認識」という考え方はすでに終わっていると思う 23 users(推定) ■ パソコン買ったらまず最初に入れとくべき音声認識 24 users(推定) ■ ブロガーなら知っておくべき音声認識の5つの法則 55 users(推定) もう終わっ…

音声認識での文章作成術について

http://blog.livedoor.jp/stone06/archives/50949455.htmlアツい思いは伝わってくるのだが、音声で文章を作成することの意義というのが、脳活性化とかの方面から証明されないとディクテーションの普及は難しいのかもしれん。日本人って羞恥心が強くて健康食…

IBM ViaVoiceがNuanceに買収される

http://japan.nuance.com/viavoice/いつの間にViaVoiceを買っていたんだ。Nuanceは。。。Wikipediaを見るとNuanceの歴史ってのは買収の歴史だなぁ。2005年にYahoo!にエンジニアが数人逃げたってのは知らなかったけど。http://en.wikipedia.org/wiki/Nuance_C…

MIT FST Toolkitが1.2.1にバージョンアップ

していた。http://people.csail.mit.edu/ilh/fst/バージョン番号は1.2.1。日付は5/14になっているので、まさに今日バージョンアップしたのかな。 MacOSXはサポートプラットホームじゃないせいかLeopardでMakeしたら、src/lib/FSTPack.cpp で min()関数が無い…

ATRと内田洋行がe-Learning の会社を設立

国際電気通信基礎技術研究所(ATR)と内田洋行が語学教育の新会社を設立 http://release.nikkei.co.jp/detail.cfm?relID=188028&lindID=1これは驚いた。この組み合わせは全く予想もしてなかった。個人名で株主になっている人がいますが、ATRの音声研究者…

eng-htk-usersの敷居の高さは異常

https://lists.cam.ac.uk/mailman/listinfo/eng-htk-users Read the documentation in the HTK Book (at least twice) and think about it!意訳:HTK Bookを(最低2回)読み込んで考えろ!って。。。 ちなみに、HTK Bookって索引込みで368ページあるんだぜ…

Tellmeが音声認識による地図情報サービスをローンチ

http://www.tellme.com/youBlackBerry端末という制限があるけど、Microsoft傘下である強みを生かして、MSの各種サービスとの連携もそれなりにやっているみたい。 GoogleのGOOG411は普通の電話機を対象としているのに対して、TellmeのはBlackBerry端末という…

ハングルのVista対応音声認識エンジンってまだ無いんですね

脊椎障害者の李尚黙(イ・サンムク)ソウル大教授は「MSのウィンドウズ・ビスタ音声認識プログラムにもハングルを採択してほしい」と要請した。李教授は‘韓国型アクセシビリティ・ラボ’の諮問的な役割を受け持っている。ハングルってスペースあるから形態…

パイオニアの新カーナビ

パイオニア、海外市場でメモリ内蔵型AVナビを発売 http://www.watch.impress.co.jp/av/docs/20080422/pioneer.htm 北米向けAVIC-F900BT/700BTのみ、自動会話型音声認識機能を搭載。VoiceBoxの会話音声サーチ技術を採用し、接続したiPodや携帯電話を音声認識…

HTKを使った自動音声セグメンテーション

http://www.voxforge.org/home/dev/autoaudiosegiKnow!の日記経由で知りました。これは結構よさそうな情報ですね。余力があったら翻訳しても良いかも。ちなみに、これは書きおこし(トランスクリプション)があった場合の音声の文の分割等に応用可能な方法で…

NECの音声認識新商品について

NEC、学習機能を音声認識エンジンに採用した音声認識議事録作成支援ソフト「VoiceGraphy1.2」 http://www.rbbtoday.com/news/20080421/50569.html 日本電気と北海道日本電気ソフトウェアは21日、音声認識技術を利用した議事録作成支援ソフト「VoiceGraphy1.2…

Googleの音声認識サービスGOOG411に関する論文

こないだのICASSP2008にGoog411に関する論文がGoogleから出ていたってのをついさっき、Official Google Research blogより知った。http://research.google.com/archive/goog411.pdfGOOG411ってのは電話で「ピザを食べたい」と話すと、勝手に音声認識システム…

「あ」の優劣の話ってすでに英語の発音矯正に使われているんじゃ、、、

「あ」の優劣。 - IHARA blog http://d.hatena.ne.jp/tihara/20080330というエントリを拝見したのだが、音響モデルのスコアリングによって「いかにネイティブの発音に近いか?」みたいなことは既にやられているんじゃなかろうかと思う。 id:tihara さんのエ…

また音声認識にがっかりする歴史が1ページ

刻まれたっぽい。富士通、「らくらくホン プレミアム」の体験会ってのが開かれたらしいのだが、 だが、会場での認識結果は、完璧とは言い難いものとなった。スタッフによれば、自由文による音声認識は大変で、クセをつかむ必要があるという。今回、「らくら…

グーグルもMSも取り組む、使える音声認識

http://pc.nikkeibp.co.jp/article/NPC/20080403/297849/なんか、こういうのを見ると、毎年「今年こそはIPTV元年」って言っているのと同じに聞こえちゃうオレはアマノジャクか? ちなみに、個人的には世の中で一番使われている音声認識アプリはゲーム関連だ…

ペリカン便の不在配達のIVRが音声認識対応になっていた

アマゾンからの配達不在票があって、次の配達日を指定するペリカン便のIVR(プッシュボタンで時間を指定するアレね)が音声認識対応になっていた。しかも、かなりの精度で認識された。というか認識率100%。送り状番号とか12ケタもあるのだが一発で認識された…

アナウンス早えーよ

http://www.interspeech2008.org/こういう国際会議では〆切りが延びるのはいつものことだが、今回は一週間前に〆切りが一週間伸びるというアナウンスが出た。 はえーよ。こういう国際的な漫才をやられては突っ込まざるを得ない。 #というかツッこんだ時点で…

AMI 下方修正

http://markets.nikkei.co.jp/kokunai/tegakari.aspx?site=MARKET&genre=c5&id=AT2D28010%2028032008あ〜あ、なんか目も当てられない情勢になってきたねぇ。 タダでさえ赤字なのにそれを下方修正ってのはちょっと無いよ。ユナイテッドパワーの一件が響いてい…

Appleが音声認識関連の特許を出願

http://itpro.nikkeibp.co.jp/article/NEWS/20080326/297035/なんか、記事見る限りでは、マイクロフォンアレイ系の特許っぽい。 MacBookのマイクって複数ついてたっけか?それとも今後出す予定でもあるのか。一応、特許へのリンクを貼っておく。なんか、これ…

サムソン電子とニュアンスがライセンス提携

http://www.ipnext.jp/news/index.php?id=3094韓国の音声認識もニュアンス一色になっちゃうのかなぁ。 ニュアンス社は音声認識界のGoogleとでも言うべき存在で、ベンチャーからスタートして競合他社の音声認識エンジンを色々買収したという経歴を持っている…

東芝が音声認識付きBluetoothチップを発表

決算期になると色々なニュースが出ますな。 http://www.ednjapan.com/content/l_news/2008/03/u3eqp3000001nk82.htmlコモディティ部品の品質には定評のある東芝の製品だからちょっと期待できる。

音声入力の話、その2

http://blog.livedoor.jp/stone06/archives/50877086.htmlここまで苦労されて音声入力を利用されているかと思うと、音声認識エンジン開発者としては泣ける。エラい!この「全文一括変換方式」って気がついている人は多いと思うんだけど、いざ実践しようとす…

Asian Workshop on Speech Science and Technology に行って来た

招待講演だけ聴いて帰って来ました。 http://www.ieice.org/iss/sp/eng/workshop/sp-h-asian.htm個人的にはMicrosoft Research Asiaの人のプレゼンがPowerPoint 2007でトラブっていたのが面白かったなぁ。 いや、内容は凄かったですよ。やっぱり、世界のMSっ…

ビルゲイツの音声認識に関するコメントについて一言言っておくか

http://japan.cnet.com/interview/biz/story/0,2000055955,20368033-3,00.htm 音声認識(については)、データベースを構築し、どのような場合に間違いが起こるのかを把握するだけに数十年かかりました。Tellme Networksが成し遂げた偉業の1つがそれです。彼…

音声認識とマイクの関係について

http://blog.livedoor.jp/stone06/archives/50863688.htmlこれほど鋭い洞察をかつて見た事がない。次回もAmiVoiceについて洞察するようなのでwktk

採掘が進んでいない鉱脈@Tech-On

http://techon.nikkeibp.co.jp/article/TOPCOL/20080221/147804/これ、面白いね。 「音声処理技術にかかわる研究者の数は,画像処理技術と比べると驚くほど少ない」(奥乃氏) やっぱり、画像認識に比べると、音声認識ってタスクが難しいわりに地味に写るん…

"Speech Recognition" と "Voice Recognition" の違い

WinVista Voice Recognition - Alias SEXO C++ - El Sexo Vende. 上記の動画を見て思ったんだけど、"Speech Recognition"と"Voice Recognition"ってどういう風に使い分けられているんだろう、と思った。困ったときのWikipediaで、"Voice Recognition"で検索…

MSの医療系情報システムがアップデート

マイクロソフトが健康管理企業の情報システム「アマルガ」を発表 http://www.nejinews.co.jp/news/release/eid417.htmlGoogleアラート経由で知ったニュース。医療は音声認識が活用される場として有望な市場だけど、その分、要求仕様がめちゃくちゃ高い。 統…

音声SOA版 オープンソース vs プロプライエタリ

オープンソース側:和歌山大学 http://w3voice.jp/プロプライエタリ側:日本アバイア http://journal.mycom.co.jp/news/2008/02/10/003/どっちも狙っているところは同じだろうね。