中国学术期刊网络出版总库
  关闭
基于深度神经网络的蒙古语声学模型建模研究  
   推荐 CAJ下载 PDF下载
【英文篇名】 Mongolian acoustic modeling based on deep neural network
【下载频次】 ★★★★★
【作者】 马志强; 李图雅; 杨双涛; 张力;
【英文作者】 MA Zhiqiang; LI Tuya; YANG Shuangtao; ZHANG Li; School of Data Science &Application; Inner Mongolia University of Technology;
【作者单位】 内蒙古工业大学数据科学与应用学院;
【文献出处】 智能系统学报 , CAAI Transactions on Intelligent Systems, 编辑部邮箱 2018年 03期  
期刊荣誉:中文核心期刊要目总览  ASPT来源刊  CJFD收录刊
【中文关键词】 语音识别; 声学模型; GMM-HMM; DNN-HMM; 监督学习; 预训练; 过拟合; dropout;
【英文关键词】 speech recognition; acoustic model; GMM-HMM; DNN-HMM; supervised learning; pre-training; over-fitting; dropout;
【摘要】 针对高斯混合模型在蒙古语语音识别声学建模中不能充分描述蒙古语声学特征之间相关性和独立性假设的问题,开展了使用深度神经网络模型进行蒙古语声学模型建模的研究。以深度神经网络为基础,将分类与语音特征内在结构的学习紧密结合进行蒙古语声学特征的提取,构建了DNN-HMM蒙古语声学模型,结合无监督预训练与监督训练调优过程设计了训练算法,在DNN-HMM蒙古语声学模型训练中加入dropout技术避免过拟合现象。最后,在小规模语料库和Kaldi实验平台下,对GMM-HMM和DNN-HMM蒙古语声学模型进行了对比实验。实验结果表明,DNN-HMM蒙古语声学模型的词识别错误率降低了7.5%,句识别错误率降低了13.63%;同时,训练时加入dropout技术可以有效避免DNN-HMM蒙古语声学模型的过拟合现象。
【英文摘要】 Considering the difficulty of using the Gaussian mixture model(GMM) to adequately describe the correlation and independence hypothesis of the Mongolian acoustic features in the acoustic modeling of Mongolian speech recognition, this study investigates an acoustic model based on deep neural network(DNN). Firstly, using DNN, the internal structure of phonetic features were classified and learned to extract the Mongolian acoustic features, and a DNNHMM Mongolian acoustic model was constructed. Secondly, a trai...
【基金】 国家自然科学基金项目(61762070,61650205)
【更新日期】 2018-05-22
【分类号】 TN912.34;TP183
【正文快照】 Mongolian acoustic modeling based on deep neural networkMA Zhiqiang,LI Tuya,YANG Shuangtao,ZHANG Li(School of Data Science&Application,Inner Mongolia University of Technology,Hohhot 010080,China)典型的大词汇量连续语音识别系统(large voca-bulary continuous

xxx
【相似文献】
中国期刊全文数据库
中国优秀硕士学位论文全文数据库
中国博士学位论文全文数据库
中国重要会议论文全文数据库
中国重要报纸全文数据库
中国学术期刊网络出版总库
点击下列相关研究机构和相关文献作者,可以直接查到这些机构和作者被《中国知识资源总库》收录的其它文献,使您全面了解该机构和该作者的研究动态和历史。
【文献分类导航】从导航的最底层可以看到与本文研究领域相同的文献,从上层导航可以浏览更多相关领域的文献。

工业技术
  无线电电子学、电信技术
   通信
    电声技术和语音信号处理
     语音信号处理
      语音识别与设备

工业技术
  自动化技术、计算机技术
   自动化基础理论
    人工智能理论
     人工神经网络与计算
  
 
  CNKI系列数据库编辑出版及版权所有:中国学术期刊(光盘版)电子杂志社
中国知网技术服务及网站系统软件版权所有:清华同方知网(北京)技术有限公司
其它数据库版权所有:各数据库编辑出版单位(见各库版权信息)
京ICP证040431号    互联网出版许可证 新出网证(京)字008号