中国学术期刊网络出版总库
  关闭
运用核聚类和偏最小二乘回归的歌唱声音转换  
   推荐 CAJ下载 PDF下载
【英文篇名】 Conversion of singing voice based on kernel clustering and partial least squares regression
【下载频次】 ★★
【作者】 方鹏; 李贤; 汪增福;
【英文作者】 FANG Peng; LI Xian; WANG Zengfu; Department of Automation; University of Science and Technology of China; Institute of Intelligent Machines; Chinese Academy of Sciences; National Engineering Laboratory of Speech and Language Information Processing;
【作者单位】 中国科学技术大学信息科学技术学院; 中国科学院合肥智能机械研究所; 语音及语言信息处理国家工程实验室;
【文献出处】 智能系统学报 , CAAI Transactions on Intelligent Systems, 编辑部邮箱 2016年 01期  
期刊荣誉:中文核心期刊要目总览  ASPT来源刊  CJFD收录刊
【中文关键词】 计算机视觉; 语音转换; 歌唱声音; 核聚类; 偏最小二乘回归; 高斯混合模型; MLSA;
【英文关键词】 computer vision; voice conversion; singing voice; kernel clustering; partial least squares regression; Gaussian mixture model; Mel log spectrum approximation;
【摘要】 语音转换是计算机听觉领域的热点问题之一,将歌声运用于语音转换是一种新的研究方向,同时拓宽了语音转换的应用范围。经典的高斯混合模型的方法在少量训练数据时会出现过拟合的现象,而且在转换时并未有效利用音乐信息。为此提出一种歌唱声音转换方法以实现少量训练数据时的音色转换,并且利用歌曲的基频信息提高转换歌声的声音质量。该方法使用核聚类和偏最小二乘回归进行训练得到转换函数,采用梅尔对数频谱近似(MLSA)滤波器对源歌唱声音的波形直接进行滤波来获得转换后的歌唱声音,以此提高转换歌声的声音质量。实验结果表明,在少量训练数据时,该方法在相似度和音质方面都有更好的效果,说明在少量训练数据时该方法优于传统的高斯混合模型的方法。
【英文摘要】 Voice conversion is a popular topic in the field of computer hearing,and the application of singing voices to voice conversion is a relatively new research direction,which widens the application scope of voice conversion.When a training dataset is small,the conventional Gaussian mixture model( GMM) method may cause overfitting and insufficient utilization of music information. In this study,we propose a method for converting the voice timbre of a source singer into that of a target singer and employ fundame...
【基金】 国家自然科学基金资助项目(61472393,613031350)
【更新日期】 2016-04-08
【分类号】 TN912.3
【正文快照】 Conversion of singing voice based on kernel clustering andpartial least squares regressionFANG Peng1,2,3,LI Xian1,3,WANG Zengfu1,2,3(1.Department of Automation,University of Science and Technology of China,Hefei 230027,China;2.Institute of Intelligent Ma-

xxx
【读者推荐文章】中国期刊全文数据库
【相似文献】
中国期刊全文数据库
中国优秀硕士学位论文全文数据库
中国博士学位论文全文数据库
中国重要会议论文全文数据库
中国重要报纸全文数据库
中国学术期刊网络出版总库
点击下列相关研究机构和相关文献作者,可以直接查到这些机构和作者被《中国知识资源总库》收录的其它文献,使您全面了解该机构和该作者的研究动态和历史。
【文献分类导航】从导航的最底层可以看到与本文研究领域相同的文献,从上层导航可以浏览更多相关领域的文献。

工业技术
  无线电电子学、电信技术
   通信
    电声技术和语音信号处理
     语音信号处理
  
 
  CNKI系列数据库编辑出版及版权所有:中国学术期刊(光盘版)电子杂志社
中国知网技术服务及网站系统软件版权所有:清华同方知网(北京)技术有限公司
其它数据库版权所有:各数据库编辑出版单位(见各库版权信息)
京ICP证040431号    互联网出版许可证 新出网证(京)字008号