2018年5月3日木曜日

Alexaのホットワード検出エンジン"snowboy"でgoogleアシスタントを起動(環境構築編)

amazon Alexaのarexa-avs-sample-appで使われているホットワード検出エンジン"snowboy"でカスタムホットワードを設定し、googleアシスタントが起動できました。
長くなったので2部構成の記事です。

snowboyとは?

独自のホットワードを検出できる、ディープラーニングによるホットワード検出エンジンです。特徴は以下5つ。
・任意のホットワードはオンラインのwebサイトで作成→誰でもホットワードを作成可能
オフラインで動作は完結→googleのように音声データをサーバーにアップしない
・初代ラズパイでもCPU使用率10%未満と軽量
・マシンリソースが許す限り、複数のホットワードを設定可能
・オープンソースかつApachライセンス

snowboy実行環境の構築

OSはubuntu 14.04(x64)を使っています。
構築方法はhttp://docs.kitt.ai/snowboy/より抜粋しています。

1.ビルド済みのバイナリをダウンロード
http://docs.kitt.ai/snowboy/
"Downloads"の"64 bit Ubuntu" 14.04のリンクをクリック。
ダウンロードしたら展開もしておきます。

2.必要なパッケージをインストール
sudo apt-get install python-pyaudio python3-pyaudio sox
pip install pyaudio

3. サンプルを実行
展開したフォルダにカレントディレクトリを移動して
python demo.py resources/snowboy.umdl
英語の発音が下手な自分だとなかなか認識されませんでした(;´Д`)
 

カスタムホットワードの作成

webサイトにて単語を3回発音するだけでカスタムホットワード用のモデルが作成できます。
https://snowboy.kitt.ai/
右上のログインからgithubなりgoogleのアカウントなりでログインします。
ログイン後、Create Hotwordボタンで任意のホットワードを作成できます。

0 件のコメント :