音声認識設定

音声認識エンジンの調整、マイクの音量調節、呼びかけワードの設定を行います

概要
音声認識エンジンの調整を行います。
FHCには、複数の音声認識エンジンを搭載しています。
それぞれに特徴があります。

音声認識エンジンの種類
音声認識エンジンの調整を行います。
FHCには、3つの音声認識モードがあります。

・2パスチェックをする
ディフォルトで選択されている音声認識エンジンです。
複数の音声認識エンジンを組み合わせることでより強力な誤認識フィルターを実現しています。

・簡易認識をする
誤認識フィルタを通さない音声認識です。
高速に動作しますが、精度が下がり誤動作のリスクがあります。

・音声認識を利用しない
音声認識をオフにします。

音声認識エンジンの1次フィルタオプション
1次誤認識フィルタのオプションを設定します。

・呼びかけサポーター
呼びかけ部分をチェックする時に比較検討する候補のレベルを設定します。
「コンピューター、電気つけて」の「コンピューター」の部分を呼びかけと呼びます。
数字を下げるとと、寛大になり、曖昧な入力でも受け付けるようになります。
デメリットとして、下げすぎると間違った声を命令と解釈して誤動作してしまうリスクが増えます。

数字を上げると、より厳格になり、正確に発音しないと受け付けなくなります。
デメリットとして、上げるぎると、正しい発音だけどノイズなどで曖昧になっていると棄却されてしまうことが増えます。



・命令サポーター
命令部分をチェックする時に比較検討する候補のレベルを設定します。
「コンピューター、電気つけて」の「電気つけて」の部分を命令と呼びます。

呼びかけサポーターと同じく、
数字を下げるとと、寛大になり、曖昧な入力でも受け付けるようになります。
デメリットとして、下げすぎると間違った声を命令と解釈して誤動作してしまうリスクが増えます。

数字を上げると、より厳格になり、正確に発音しないと受け付けなくなります。
デメリットとして、上げるぎると、正しい発音だけどノイズなどで曖昧になっていると棄却されてしまうことが増えます。



・通過確率
マッチした命令部がどれだけ他の命令に比べて正しいか、自信があるかを示す確率の閾値になります。
「コンピューター、電気つけて」の「電気つけて」の部分を命令と呼びます。
この命令の部分が、どれだけそれっぽいかを示す確率があります。
その確率が、指定地以上だったら採用します。指定地以下だったら棄却します。
値を小さくすると、曖昧な声でも認識しますが、誤動作のリスクがあります。
大きくすると、より強固になりますが、曖昧な声では認識しなくなります。

音声認識エンジンの2次フィルタオプション
2次誤認識フィルタのオプションを設定します。
2パスチェックするときだけ設定できます。

2次フィルタは、呼びかけ部分を再検証します。

・2次フィルタサポータ強度
2次フィルタで、再度呼びかけ部分をチェックする時に比較検討する候補のレベルを設定します。
「コンピューター、電気つけて」の「コンピューター」の部分を呼びかけと呼びます。
数字を下げるとと、寛大になり、曖昧な入力でも受け付けるようになります。
デメリットとして、下げすぎると間違った声を命令と解釈して誤動作してしまうリスクが増えます。



・2次フィルタ通過確率
マッチした呼びかけ部部がどれだけ他の命令に比べて正しいか、自信があるかを示す確率の閾値になります。
「コンピューター、電気つけて」の「コンピューター」の部分を呼びかけと呼びます。
この命令の部分が、どれだけそれっぽいかを示す確率があります。
その確率が、指定地以上だったら採用します。指定地以下だったら棄却します。
値を小さくすると、曖昧な声でも認識しますが、誤動作のリスクがあります。
大きくすると、より強固になりますが、曖昧な声では認識しなくなります。
音声認識エンジンの発話スピードオプション
・発話スピード
発音するデータに対しての理想的な発話スピードをきめます。
高齢の方などの場合、発話スピードが遅くなることがあるようなので、その場合は少しだけ大きめにしてください。

音声認識エンジンと精度と評価
音声認識には、3つの評価基準があります。
動作速度、正しいものがどれだけ拾えるか、正しくないものを拾わないかです。
動作速度は、音声認識の処理時間です。
FHCでは、遅くてもも3秒以内にすべての処理を完了できるように作られています。
エンジンによっては、もっと早く1秒程度で処理することもできます。
ただ、時間を優先すると、精度が犠牲になります。

正しいものがどれだけ拾えるかは、
正しく発音した音をどれだけ聞きくとれるかです。
これができないと、話しかけたのに無視されたということになります。

正しくないものを拾わないかは、
生活の中の音を拾って、それに本来命令されていないのに、命令されたと思い込んで動作してしまうことです。
FHCでは、これが発生しないことを優先して、研究開発されています。

理想は、これらの3つのパラメータをすべて満点にしたいところですが、、、

マイク音量
マイクの音量です。
通常は最大音量のままにしてください。

呼びかけワード
音声認識をスタートさせる呼びかけワードです。
表記のゆれを吸収するため5つまで設定出来ます。

設定にはいくつかのルールがあります。

・最初の2文字は同じ文字にしなければいけません。
「コンピュータ」を設定する場合、2番目に設定できるのは、最初の2文字の「コン」から始まる単語だけです。
例えば、「コンピュータ」と「コントローラー」は同時に設定することができます。
ですが、「コンピューター」と「テスト」は、先頭2文字が一致していませんので、設定出来ません。

・最低4文字以上、6文字程度を推奨します。
短すぎる呼びかけは誤動作を引き起こします。
呼びかけワードには、最低4文字は以上必要です。
6文字程度をおすすめします。

・平仮名・カタカナでいれてください。
誤読を避けるために、呼びかけワードは、平仮名・カタカナで入れてください。

イベント音
音声認識の成功、失敗時に音を鳴らすことができます。(ver 1.07以上)