音声認識できるか!?騒音のある環境や距離を変えてTZ2100を実験してみた

TZ2100の音声ソリューションボードには、MEMSマイクが搭載されています。今回の実験は、静かな屋内や屋外(公園、交差点)でどの程度音声認識ができるのかを実験してみました。距離は、50cm、100cm、200cmとしました。また、各環境の騒音をスマホアプリで計測しました。正確性は不透明な部分がありますので、あくまで参考値としてみてください。

オフィス内

かなり静かなオフィス内で実験してみました。屋内では、マイクの位置を正面にすると正しく認識できるので、あえて横にしてみました。騒音計の結果は、50dBくらいでした。

図

距離 50cm 100cm 200cm
結果

屋内のオフィス内のような静かな環境では、特に問題なく認識できると考えられます。

公園

話し声などが少し聞こえる屋外の公園で、正面に向けて計測してみました。騒音計の結果は、63dBくらいでした。

図

距離 50cm 100cm 200cm
結果

屋外の公園は、オフィスほどの静寂性はありませんが、マイクに向かって話しかける分には問題ないかと思います。さすがに200cm離れると、若干認識具合が異なると思います。これは、マイクによっても変わる部分なので、ハードウェア的な問題でクリアできる程度の課題です。

交差点(電車通過なし)

車の往来がある交差点で、正面に向けて計測してみました。騒音計の結果は、77dBくらいでした。通る車によって、騒音の振れ幅が一番あります。

図

距離 50cm 100cm 200cm
結果

屋外の交差点は比較的交通量もあり、周囲環境としては雑音がかなり多い環境と言えます。事前の予想とは裏腹に、そんな環境下でも比較的音声を拾ってくれました。

交差点(電車通過あり)

電車が通過したときにテストしてみましたが、騒音計の結果は、84dBくらいでした。鉄橋真下では、90dBくらい出るときもありました。

図

距離 50cm 100cm 200cm
結果 ×

屋外の交差点で、電車が通過した時は、音声認識がうまくいかない時が多かったです。もっと大きな声を出せば認識できる範囲です。ただ、今回の実験ではなるべく同じ声の大きさになるように心がけたため、周囲音によっては認識が難しかったようです。

まとめ

これまでの結果を簡単にまとめてみました。

オフィス  公園  交差点
(電車なし)
交差点
(電車あり)
50cm ×
100cm
200cm
騒音[db] 50 63 77 84

マイクを変えることや、もう少し長い言葉で認識できるようにすると、いいのかもしれませんね。TZ2100の音声ソリューションを、実際の組み込みシステムに使う際には、単語登録以外にも、MEMSマイクの選定も重視してみるといいでしょう。また、もっとノイズが多い環境では、ノイズキャンセリング処理を追加してもいいかもしれません。

【アプリ協力】Decibel X © SkyPaw Co., Ltd. http://skypaw.com/decibel10.html