听觉传感器是人工智能装置,是机器人中必不可少的部件;它是利用语音信号处理技术制成的。机器人由听觉传感器实现“人一机”对话。一台高级的机器人不仅能听懂人讲的话,而且能讲出人能听懂的语言,赋予机器人这些智慧和技术统称语音处理技术,前者为语言识别技术,后者为语音合成技术。具有语音识别功能的传感器称为听觉传感器。

       听觉传感器是检测出声波(包括超声波)或声音的传感器。用于识别声音的信息传感器。在所有的情况下,都使用话筒等振动检测器作为检测元件。

       这里主要介绍具有识别声音功能的,相当于人的听觉的传感器。声音信息处理技术,从声音的波形分析,声音合成等已达到某种实用的程度。声音识别可分为如下两种方式:

       1.注册讲话人的识别方式

       声音识别实质上是通过模式识别技术识别未知的输入声音。通常分为特定说话者和非特定说话者两种声音识别方式。后者为自然语音识别,这种语音的识别比特定人语音识别困难得多。特定说话者的语音识别技术已进入了实用阶段,而自然语音的识别尚在研究阶段。特定语音识别是预先提取特定说话者发音的单词或音节的各种特征参数并记录在存储器中,要识别的输入声音属于哪一类,决定于待识别特征参数与存储器中预先登录的声音特征参数之间的差。

       说话人的识别按照任务可以分为说话人辨认和说话人确认。说话人辨认是指通过一段语音从已注册的说话人群中分辨出特定说话人的声音,辨认其身份的过程,是“多选一”的问题。说话人确认是证实某一特定说话人与他所声明的身份一致性的过程,系统只需给出接受或拒绝两种选择,是“一对一”判别问题。另外,与其他生物技术类似,若考虑待识别的说话人是否在注册的说话人群范围内。自动说话人识别的研究始于20世纪60年代,在以后的几十年中,研究人员不断在特征取样、模型匹配、对环境的适应性等方面深入研究,说话人识别技术也从小型的、实验室条件下、受控制的系统向实用化发展。如今,说话人识别技术已逐渐进入应用化阶段,并进入人们的生活中。

       实现这一技术的大规模集成电路的声音识别电路已商品化了,其代表型号有TMS320C25FNL、TMS320C25GBL、TMS320C30GBL和TMS320C50PQ等。采用这些芯片构成的传感器控制系统如图所示。

    机器人常用的传感器--之--滑觉传感器 

      这样的听觉传感器,可以有效地用于告诉机器人如何进行操作,从而构成声音控制型机器人。而且现正在研制可确认声音合成系统的指令,与操作员对话的机器人。

       2.任意(未注册)讲话者的识别方式。

       由于讲话人没有预先注册,所以必须对任意说话人进行特征提取。说话人识别系统中的特征提取即提取声音信号中表征人的基本特征,此特征应能有效地区分不同的说话人,且对同一说话人的变化保持相对稳定。由于说话人的声音特征和说话人的个性特征总是交织在一起,目前还没有找到将二者很好地分离的方法。尽管如此,语音信号的特征参数仍从不同侧面反映出说话人的个性,仍是说活人特征的重要来源。虽然人们在判断说话人时可以利用一些高层特征,如说话人的习惯风格、情感状态、遣词造句的特点等,但到目前为止没有好的方法将其定量化或找到它们与声音信号特征参数之间的关系,故不能在任意说话人识别中得到很好的应用。


您的评论
用户评论
相关文档推荐
热门标签