离线_离线语音识别技术品鉴——功能不同各有千秋

前几天,谷歌公布了一种新的离线语音识别模型。 新模型缩小了系统中被称为“解码图形”的部分,该组件的功能类似于书本索引,使声音波形与书面文字匹配。 但是,现在只在谷歌键盘应用Gboard工作,只在Pixel工作,只适用于美国英语。

据业内人士介绍,语音识别是Siri、Alexa、Google等智能手机目前最重要的组成部分。 但是,这些语音识别系统之所以有很大的缺点,是因为有相应的延迟,用户必须等待Siri或其他虚拟助手回答问题,很可能会误解为语速过快。 为了实现这一变化,谷歌研究问题,简化语音识别的新AI系统花了5年时间。

没有独特的巧合,来自深圳的轻生活科学技术有限公司(简称轻生活科学技术)也推出了脱机语音识别相关技术产品——脱机语音识别模块QLIFE-ASR06M和QLIFE-ASR01M。 与谷歌发表的离线语音识别产品不同,轻生活技术的离线语音识别模块具有离线语音识别、背景噪声降低、回声消除等特点。 本系列模块主要针对电子设备、照明、电工等智能家居行业的制造商,提供一站式服务,可实现低成本、无风险、智能产品的快速升级。

虽然两家企业都发表了脱机语音识别的相关技术,但其功能各不相同,特征也各不相同。

下面是轻生活技术的离线语音识别模块

QLIFE-ASR06M (轻生活技术脱机语音识别模块)

方案特点:

1、模块在10米以内可实现95%以上的本地语音识别率

2 .支持汉语和英语两种语言

3、支持离线指令约100条

4、支持单MIC、降噪功能

5 .支持回声消除功能

6、外围可直接连接麦克风和扬声器

七十四个GPIO可以与其他功能复用

8 .语音识别响应时间200-800ms

QLIFE-ASR01M (轻生活技术脱机语音识别模块)

方案特点:

1 .支持大陆普通话、英国英语、美国英语、希腊语、西班牙语、俄语、法语等34种外语的非特定语音命令语言识别

2 .支持自定义命令集,支持自定义唤醒词,支持语音响应,支持串行通信,易于与主MCU通信

3 .内置mic偏置值和自动增益算法,单支mic输入也能支持3~5米远场识别

4 .支持睡眠ms级唤醒功能和低功耗管理

5 .支持录音和播放功能,完全替换传统语音芯片的功能

6 .支持多个语音觉醒名称和连续指令模式

7 .还可以支持其他可定制的功能

8 .小尺寸: 26x22x3mm;

9 .支持补丁和连接器方式( 2.0mm ),灵活方便

10 .外围设备非常简单,只需访问MIC和扬声器,单电源供电就能满足基本使用要求

11.8欧元1W扬声器可直接驱动,进行语音识别语音响应

12.UART返回语音识别结果,以便于调试和系统集成

13 .接收UART命令进行功能扩展。

大家都在看

相关专题