| 自動音声認識ソフトの種類 現在主なパソコンメーカからいろいろな音声認識ソフトが発売されています.価格は数千円から2万円程度までいろいろです.ここで想定しているユーザにとって,音声認識ソフトを選択する際の考慮するべき項目としては以下のようなことが挙げられます. 1) 音声認識の識別率が良いこと 2) 同音異義語,文節の分かれめなどを正しく変換してくれること 3) ユーザの発声の特徴をパソコンが学習するためのエンロールという作業が簡単なこと 実はこれらのことは独立なことではなく,相互に関連をもっています.不明瞭は発音でも辞書をうまく利用し,ユーザの発声の特徴を参照しながら,日本語としてもっともらしい文節・漢字変換をする(そうなるように音声を認識する) という高度な作業を行っているのです. 当社でも3年ほど前に1回だけ各社の音声認識ソフトを比較しましたが,1)−3)の点+価格の面で,とても今考えている目的には使えないと判断しました. しかし,2002年4月にもう一度代表的な音声認識ソフトを調べたところ格段の進歩がありようやくこの方面での実用の段階にさしかかっていると感じました. そのなかで,ジョイマウスに最も適していると思われたのが,日本IBM社から発売されている Via Voice with ATOK15 です.以下に,もう少し詳しくこのソフトを御紹介します.もちろん,ジョイマウスは音声認識ソフトとは独立に動作しますから,他の音声認識ソフトと一緒に使っていただくことも可能です. |
| ViaVoice with ATOK15の紹介 ViaVoice with ATOK15 は2002年4月に日本IBM社から発売された自動音声認識ソフトです.定評のあるIBM社の音声認識エンジンとジャストシステム社の優れた日本語連文節変換ATOK15の良いところを併せて作られています.このソフトのよいところは 1) VoiceATOK という,音声で変換・再変換・消去・簡単なカーソル移動等を行うことので きる機能を搭載している 2) エンロールにかかる時間が短い(約10−15分;3年前は1−2日かかりました!) 3) ユーザーの目的に合わせてシステムをカスタマイズする自由度が高い;その割に標準モードでもそれなりの性能を発揮してくれる 4) 価格が適正である(実勢価格12,000円程度) 弱いところは 1) 日常的な文章は比較的うまく識別・変換してくれるが,パソコンの専門的な用語などは整っておらず,ユーザが自分で辞書を作っていかなければならない. 2) 上記3)のカスタマイズの方法につしてのマニュアルの記述がわかりにくい といったところでしょうか. いずれにせよ,普通の日常生活的文章やビジネス文章を作る上ではかなり高い機能を持っているといえましょう. |