节点文献

中文连续语音识别系统音素建模单元集的构建

Phoneme modeling units design for Mandarin LVCSR systems

  • 推荐 CAJ下载
  • PDF下载
  • 不支持迅雷等下载工具,请取消加速工具后下载。

【作者】 包叶波胡郁刘聪江辉戴礼荣刘庆峰

【Author】 BAO Yebo~1,HU Yu~2,LIU Cong~2,JIANG Hui~3, DAI Lirong~1,LIU Qingfeng~(1,2) (1.Department of Electronic Engineering and Information Science, University of Science and Technology of China,Hefei 230027,China; 2.Anhui USTC iFLYTEK Company Ltd,Hefei 230088,China; 3.Department of Computer Science and Engineering, York University,Toronto M3J 1P3,Canada)

【机构】 中国科学技术大学电子工程与信息科学系安徽科大讯飞信息科技股份有限公司约克大学计算机科学与工程系

【摘要】 在识别系统中,建模单元能够勾画一种语言的声学和语音学特性,因此对系统性能起到至关重要的作用。该文参照一些已在大词汇量连续语音识别系统(LVCSR)中取得较好效果的建模单元集,构建了新的音素建模单元集(NewPS)。另外,根据NewPS中元音及其变体对前后接音素协同发音的影响,提出了基于扩展的元音三角图设计问题集(NewQS)的方法。实验表明:NewPS和NewQS结合的识别性能超越了传统的声韵母建模单元集;并且,建模单元数目大幅度的减少给系统后续模块的处理带来了便利。

【Abstract】 Modeling units can be used to describe the salient acoustic and phonetic information for a language in speech recognition systems.Thus,they play a very important role in the system.This paper describes a phoneme set using several modeling units,which has good performance in large vocabulary continuous speech recognition(LVCSR) systems.A question set design method is given based on the extended vowel triangle.Tests show that the combination of the new phoneme set and the new question set surpasses the initial/final in performance.AJso,the number of modeling units is greatly reduced which is more convenient for processing succeeding system modules.

  • 【会议录名称】 第十一届全国人机语音通讯学术会议论文集(二)
  • 【会议名称】第十一届全国人机语音通讯学术会议
  • 【会议时间】2011-10-16
  • 【会议地点】中国陕西西安
  • 【分类号】TN912.34
  • 【主办单位】中国中文信息学会语音信息专业委员会、中国声学学会语音、听觉和音乐声学分会、中国语音学会语音学分会
节点文献中: 

本文链接的文献网络图示:

本文的引文网络