KWS20_demo演示了使用MAX78000 EVKIT识别多个关键词。
KWS20演示软件使用了谷歌语音命令数据集的第二个版本,该数据集由35个关键词和超过10万个话语组成:
https://storage.cloud.google.com/download.tensorflow.org/data/speech_commands_v0.02.tar.gz
完整数据集中的以下20个关键字子集用于此演示:
['up', 'down', 'left', 'right', 'stop', 'go', 'yes', 'no', 'on', 'off', 'one', 'two', 'three', 'four', 'five', 'six', 'seven', 'eight', 'nine', 'zero']
其余的关键字和未识别的单词属于“未知”类别。
默认出厂demo就是,如果你没有修改烧录过,可以直接体验。如果没有看下面 编译指南。
使用串口工具查看结果。
亲测识别非常惊人。无论是电脑上的合成语音。还是不太标准,不一样音色的都可以轻松识别。
视频演示 :
例程学习,编译参考
0x1: 点击新建 程序,选择配置 和例子,点Finish
0x2: 右键单击项目,选择Build project
提示如下:
开始烧录:
右键选择 Run AS.Run Configurations..
选择刚才创建的 项目名,kv20 开始烧录。
就可以体验,语音识别多个关键词的例程了