语音识别

语音识别技术,也被称为自动语音识别(英语:Automatic Speech Recognition, ASR),其目标是将人类的语音中的词汇内容转换为计算机可读的输入,并且与计算机进行交互。

例如按键、二进制编码或者字符序列。

与说话人识别及说话人确认不同,后者尝试识别或确认发出语音的说话人而非其中所包含的词汇内容。语音识别技术的应用包括语音拨号、语音导航、室内设备控制、 语音文档检索、简单的听写数据录入等。语音识别技术与其他自然语言处理技术如机器翻译及语音合成技术相结合,可以构建出更加复杂的应用,例如语音到语音的翻译。

语音识别技术所涉及的领域包括:信号处理、模式识别、概率论和信息论、发声机理和听觉机理、人工智能等等。

实验室语音方面研究主要包括语音识别,语音评估两个方面的研究,主要的集中的工作在如何实现高准确率,高效率的中文连续语音识别系统以及语音发音标准评估系统。

主要研究方向:

  • 语音识别

重点在连续中文语音识别方面,通过研究和改进语音识别数学模型,使模型更适合于中文语音特点,从而提高中文语音识别的准确率,并且应用到工程项目当中。

  • 语音评估,语音教学

重点研究在连续语音环境,查找说话人语音的当中的发音错误,对说话人声音进行评分,并且纠正说话人错误的发音。