“声控时代”的智能终端如何听?听什么?


  未来,人工智能会像水和电一样无所不在,在“万物互联时代”,语音将成为人机交互的新常态。风吹麦浪,静夜虫鸣。人类能听到的声音大约有40多万种,频率在20至20000赫兹之间。智能终端能听到多少呢?


  如果人有听力障碍可以选佩助听器来帮助收听,那么机器呢?在嘈杂的环境下,也会存在听不清指令的情况,怎么破?别担心,有一种叫“麦克风阵列”的东西帮助机器聆听,从而可以像人耳一样灵敏。



  麦克风阵列(Microphone Array),从字面上指的是麦克风的排列。也就是说由一定数目的声学传感器(一般是麦克风)组成,用来对声场的空间特性进行采样并处理的系统。



  题外话,麦克风阵列你可以理解为很多的麦克风一起收音,但是需要按照一定的排列顺序来放置,只有这样才能收集清晰到声音,从而方便机器后台处理。


  早在20世纪70、80年代,麦克风阵列已经被应用于语音信号处理的研究中,进入Z时代以来,基于麦克风阵列的语音信号处理算法逐渐成为一个新的研究热点。在我们全面进入“声控时代”,这项技术的重要性显得尤为突出。麦克风阵列究竟能帮我们能干什么?


  语音增强——抗噪利器



  从20世纪60年代开始,Boll等研究者先后提出了针对使用一个麦克风的语音增强技术,称为单通道语音增强。因为它使用的麦克风个数最少,并且充分考虑到了语音谱和噪声谱的特性,使得这些方法在某些场景下也具有较好的噪声抑制效果,并因其方法简单、易于实现的特点广泛应用于现有语音通信系统与消费电子系统中。



  我们日常生活中经常碰到的一种多源噪音——车噪。一般而言,汽车噪音有四大“源头”:发动机噪音、轮胎噪音、空气中的噪音和车身结构造成的噪音。这么多噪音真的还能使用语音?通过麦克风阵列就可以。


  在复杂的声学环境下,噪声来自于四面八方,且其与语音信号在时间和频谱上常常是相互交叠的,再加上回波和混响的影响,利用单麦克风捕捉相对纯净的语音是非常困难的。而麦克风阵列融合了语音信号的空时信息,可以同时提取声源并抑制噪声。


  声源定位——无惧说话人走动



  现实中,声源位置是在不断变化的,这对收音来说,是个障碍。麦克风阵列则可以进行声源定位,声源定位技术是指使用麦克风阵列来计算目标说话人的角度和距离,从而实现对目标说话人的跟踪以及后续的语音定向拾取,是人机交互、音视频会议等领域非常重要的前处理技术。所以麦克风阵列技术具有灵活的波束控制、较高的空间分辨率、高的信号增益与较强的抗干扰能力等特点,因而成为智能语音处理系统中捕捉说话人语音的重要手段。


  混响消除——减少室内回声干扰



混响干扰信号频谱



去混响后的信号频谱


  由于混响则会使得不同步的语音相互叠加,带来了音素的交叠掩蔽效应,从而严重影响语音识别效果。根据研究,影响语音识别的部分一般是晚期混响部分,所以去混响主要是放在如何去除晚期混响上面。多年来,去混响技术抑制是业界研究的热点和难点。利用麦克风阵列去混响的主要方法有以下几种:


  1、基于盲语音增强的方法,即将混响信号作为普通的加性噪声信号,在这个上面应用语音增强算法。


  2、基于波束形成的方法,通过将多麦克风对收集的信号进行加权相加,在目标信号的方向形成一个拾音波束,同时衰减来自其他方向的反射声。


  3、基于逆滤波的方法,通过麦克风阵列估计房间的冲击响应,设计重构滤波器来补偿来消除混响。


  现在科大讯飞实现的基于麦克风阵列的去混响技术,能很好的对房间的混响情况进行自适应的估计,从而很好的进行纯净信号的还原,显著提升了语音听感和识别效果。


  声源信号提取-分离七嘴八舌找出点


  


  当家里说话人太多,收音的智能终端到底听谁的!这个时候就需要从七大姑八大姨的声音中辨别出哪个声音才是主人的指令。而麦克风阵列可以实现声源信号提取,声源信号的提取就是从多个声音信号中提取出目标信号,声源信号分离技术则是将需要将多个混合声音全部提取出来。


  利用麦克风阵列做信号的提取和分离主要有以下几种方式:


  1、基于波束形成的方法,即通过向不同方向的声源分别形成拾音波束,并且抑制其他方向的声音,来进行语音提取或分离:


  2、基于传统的盲源信号分离的方法进行,主要包括主成分分析(PCA)和基于独立成分分析(ICA)的方法。


  在万物互联的今天,麦克风阵列技术已经深入我们的日常生活。在智能车载、智能家居、机器人、可穿戴设备等应用热潮正兴起的时代,语音交互由于其便捷性,成了人机交互入口的第一选择,麦克风阵列自然也成为其中非常重要的前端技术。


  • yufgnyuw.jpg
回复数 0 切换时间排序
需登录后查阅, 加载中......

目前注册实行审核/邀请制,欢迎灯友邀请好友注册,下载币奖励
邀请注册

为什么注册要审核

目前新版公测中,有任何BUG问题都可以联系我们
提交问题

或如无法回复,请访问此地址
提交问题