节点文献

唇读系统中的话者唇定位与跟踪

  • 推荐 CAJ下载
  • PDF下载
  • 不支持迅雷等下载工具,请取消加速工具后下载。

【作者】 姚鸿勋王晶山世光张洪明王瑞

【机构】 哈尔滨工业大学计算机科学与工程系黑龙江省保险公司

【摘要】 在许多应用于有噪声环境下的语音识别系统中,唇读技术能有效地降低噪声的影响, 通过视觉通道来补充仅取决于听觉通道的信息量,从而提高语音识别系统的识别率。由于音韵学与视觉信息的相关性大多数都来源于嘴和唇,因此对它们进行准确而稳健的动态定位与跟踪是十分重要的。而且,对于不需用特殊的标识物和规范性的照明来对信息进行提取才能满足应用的需求。本文提出了一种有效和稳健的唇定位跟踪方法,首先用肤色模型查找脸;然后搜索脸区域内的眼睛;再根据眼的位置和脸的大小确定唇的位置;最后,我们再将上下唇的内外轮廓描述出来。

【关键词】 唇读肤色模型光流可变模板HMM模型
  • 【会议录名称】 第五届全国人机语音通讯学术会议(NCMMSC1998)论文集
  • 【会议名称】第五届全国人机语音通讯学术会议
  • 【会议时间】1998-07
  • 【会议地点】中国黑龙江哈尔滨
  • 【分类号】TP391.42
  • 【主办单位】中国自动化学会模式识别与机器智能专业委员会、中国计算机学会人工智能与模式识别专业委员会、中国电子学会信号处理学会语音图象专业通讯委员会、中国声学学会语音听觉和音乐声学分科学会、中国中文信息学会基础理论专业委员会、中国通讯学会通讯理论专业委员会、国家高技术智能计算机系统专家组
节点文献中: 

本文链接的文献网络图示:

本文的引文网络