pp电子

接待光临~广州pp电子电子科技有限公司
联系电话 手机/微信:

18925103846

您的位置: 网站首页 > 资料知识

资料知识

MX9016B-24QS语音识别芯片使用说明书V1.02

1、芯片特征

  • 半米内识别率 90%以上

  • 可以通过语音指令控制输出

  • 可以通过单片机串口控制播放指定语音

  • 三种输出模式:串口输出、IO 输出、喇叭播放

  • PWM 输出可直接推动 0.5W/8Ω 或 1W/8Ω 扬声器

  • 具有差分放大电路, ,,清静情形下语音识别距离可抵达 2-3 米

  • 外挂 SPI Flash, ,,增添存储容量

  • 可以存储多组词条, ,,可是统一时刻只能泛起一组词条

  • 非特定人语音识别

  • 语音可支持 32 种语言,现在中文识别度较好

 

2、功效形貌

MX9016B语音识别????槭且豢钚∏捎镆羰侗鹉????, ,,清静情形下语音识别距离可抵达 2-3 米;;外挂 SPI Flash,增添存储容量;;主要功效如下:

  1. 识别功效:可识别预设的语音词条, ,,同时通过串口, ,,IO 输出以及识别效果。 。。。。。

  2. 播放功效:通过单片机指令播放指定的语音, ,,同时通过 BUSY 脚标记是否正在播放语音。 。。。。。

 

3、应用规模

  • 玩具类:智能机械人、智能故事机、智能玩具车机等

  • 家电类:智能茶壶、智能电饭锅、智能音箱、智能插排、智能晾衣架, ,,智能空气净化器等

  • 理疗类:眼部推拿仪、推拿椅、头部推拿仪、足浴推拿器

  • 语音导航类:医院、阛阓等地方内指路器

4、应用方框图

????1

结构组成:MX9016B-24QS 语音识别芯片外挂SPI-flash;;可搭配麦克风、喇叭、单片机等外设一起使用。 。。。。。不过, ,,在虚线框中的串口和 IO 都是用于检测 MX9016B是否能准确识别, ,,以是在毗连 MCU(客户的)时可毗连其 IO 口或串口, ,,二选一即可。 。。。。。

 

5、芯片管脚介绍

芯片管脚图, ,,引脚凭证上图排列顺序

 

引脚

引脚标号

功效形貌

1

PWMP

数字PWM输出(+), ,,跟PWMP组合使用可直接驱动扬声器

2

VPS

PWM电源输出脚

3

VIO

PortA IO 电源输入脚

4

SPI_SO

SPI_SO脚

5

SPI_SI

SPI_SI脚

6

SPI_SCLK

SPI_SI脚

7

SPI_CS

SPI_CS脚

8

RESTINB

复位脚(烧录时需用到)

9

PC4

MIC麦克风口

10

PC3

MIC麦克风口

11

PC2

MIC麦克风口

12

AVSS

模拟地

13

BUSY

BUSY输出脚

14

OUTD

IO口/32K的晶体输出脚

15

V33O

内部LDO3.3V/1.8V 电压输出

16

VCC

电源输入脚

17

VSS

数字地

18

TX

串口发送脚

19

RX

串口吸收脚

20

OUTC

IO口/AD口

21

OUTB

烧录引脚, ,,闲置时可当IO口使用

22

OUTA

烧录引脚, ,,闲置时可当IO口使用

23

PWMN

数字PWM输出(-), ,,跟PWMP组合使用可直接驱动扬声器

24

VPD

PWM 电源输入脚

 

6、芯片电气参数

Symbol

Parameter

Min

Max

Type

Uint

VCC

事情电压

1.8

5.5

3.3

V

Iop

无负载电流

--

--

7

mA

Ta

事情温度

-20

75

--

Io

输出电流

-16

16

--

mA

 

8、芯片功效详解

8.1 IO 口功效简介

1)RXD/TXD 标准串口通讯、波特率 9600, ,,设置见下图

2)13脚为播放状态 BUSY 指示, ,,播放时为 H, ,,不播放时为 L

3)MIC  麦克风正极输入端, ,,可接常用的麦克风型号

4)PWMP/PWMN pwm 输出、可直接驱动 0.5W/8Ω 或 1W/8Ω 扬声器

 

8.2 指令名堂

 

串口指令名堂接纳:起始码+参数+反码, ,,设置如下表。 。。。。。

起始码

参数

反码

AA/BB

见下文

见下文

注:①参数+反码 = FF, ,,例如 TX 输出的指令 “AA 01 FE” , ,,起始码为 AA , ,,参数为 01 , ,,反码为 FE, ,,01+FE=FF,其他数据依此类推

②TX 输出指令起始码为 AA(见表 4), ,,RX 输入指令起始码为 BB(见表5)

 

8.3 词条相关简介

MX9016B语音识别????榭梢允迪掷慰看驶, ,,非特定人的语音识别。 。。。。。

牢靠词汇并非指词条永远无法改变, ,,而是用户不可以自行更改, ,,但开发者可以凭证需求替换词条, ,,之后将词条存储到 MX9016B-24QS 语音芯片里或是外挂的 SPI Flash 里, ,,待识别时将会拿输入的语音与存储起来的词条语音作比照, ,,若是两者相似度抵达标准就以为是输入的语音与存储中的词条一致, ,,即识别乐成。 。。。。。

8.3.1 词条的存储容量

存储词条的地方有两处:语音芯片的内部、SPI Flash;两者自己的容量差别, ,,所能存储的词条数目自然也差别。 。。。。。下面举行四字词条(即是每个词条四个字)的存储容量的比照

 

存储位置

存储词条数目

MX9016B-24S 语音芯片

12 条

SPI Flash

凭证 Flash 自身容量决议

 

虽说 MX9016B-24QS 语音芯片内部可以存储 12 条左右的词条, ,,可是存储的数目越多, ,,运算的速率越低, ,,识别的效果也会相对的差一点。 。。。。。

8.3.2 词条的存储方式

 

词条的存储方式主要有两种:

①一组存储

在词条的数目较少, ,,并且都是统一类型, ,,如都是体现颜色的词条, ,,那可以选择放在统一组中, ,,不必举行切换, ,,更省时间。 。。。。。

②分组存储

若是词条的数目多, ,,并且分类纷歧样, ,,那可以选择分组存储, ,,例如现在有三组差别类型的词条, ,,划分是故事类, ,,古诗类以及音乐类

故事类

古诗类

音乐类

 拔苗助长

望天门山

爱我中华

后羿射日

游山西村

绚烂岁月

亡羊补牢

使至塞上

良久不见

守株待兔

过零丁洋

心如刀割

将词条分组存储, ,,待需要举行古诗类词条时, ,,则需先进入古诗类词组, ,,那么我们需要一个入口。 。。。。。

 

8.3.3 词条的识别历程

词条的识别历程现实就是波形的识别。 。。。。。现实上, ,,声音会爆发波形, ,,可见如下声音波形图。 。。。。。无论是人声, ,,照旧风扇的声音, ,,都有波形, ,,可是差别的人说统一句话, ,,声音的波形都会有一点点的差别, ,,就算是统一个人说统一句话, ,,声音的波形也会有差别, ,,由于音调, ,,语速等等都可能爆发细小的转变, ,,从而影响声音波形。 。。。。。

因此, ,,在设计的历程中, ,,会设置一个门槛, ,,若输入语音的波形与存储好的词条波形相似度高于这个门槛, ,,则识别乐成。 。。。。。而这个门槛的崎岖可以改动的(用户无法更改), ,,门槛调高了, ,,即相似度要更高, ,,会更难识别, ,,识别率降低;;若门槛调低了, ,,更容易识别, ,,识别率增添, ,,可是这也带来了一个问题-----误识别。 。。。。。

在吵杂的情形中, ,,多种声音的波形叠加在一起, ,,恰恰与存储中的某一个词条的波形相似度凌驾门槛值, ,,那么就会以为是存储中的词条, ,,从而语音识别乐成, ,,这就引起了误识别, ,,若设置的门槛越低, ,,误识别率就越高。 。。。。。

以是说, ,,识别率和误识别率是一致的, ,,识别率升高, ,,误识别率也会升高, ,,这就需要凭证场合, ,,凭证需求来设计识别率。 。。。。。虽然, ,,减低误识别率是有步伐的, ,,如在不需要识别的时间, ,,让????榇τ谛菝咦刺, ,,既可以省电, ,,又可以降低误识别率。 。。。。。

8.3.4 词条的设计

 

识别率, ,,除了与识别的门槛有关, ,,还与词条的是非等有关, ,,其关系见表 6。 。。。。。

 

词条与识别效果表

词条

识别效果

太短了, ,,欠好识别

开灯

识别效果一般

关灯

与其他词条相似, ,,识别效果一般

小智, ,,开灯

长度适中、相似度低, ,,识别效果佳

我困了, ,,请关灯

长度适中、相似度低, ,,识别效果佳

因此, ,,在替换词条时, ,,应思量词条的长度, ,,各个词条间的相识度, ,,只管做到长度适中、相似度低。 。。。。。

 

由于页面限制, ,,完整内容请点击文章右上下载按钮下载文件审查……

用手机扫描二维码关闭
二维码
【网站地图】
MX9016B-24QS语音识别芯片使用说明书V1.02_广