偏最小二乘回归分析(partial least squares regression简记为PLS)是一种新型的多元统计数据分析方法,它最早产生于化学领域。PLS的一个突出特点是将多元线性回归分析、变量的主成分分析和变量间的典型相关分析有机地结合起来,在一个算法下,同时实现了回归建模、数据结构简化和两组变量间的相关分析,给多元数据分析带来极大的便利。PLS在处理样本容量小、自变量多、变量间存在严重多重相关性问题方面具有独特的优势。
但是,由于偏最小二乘回归模型最终可以表示为原有所有变量的回归方程。偏最小二乘回归方法所选择的主成分仍包含所有变量,没有完全解决变量间存在的严重多重相关性,特别是在自变量个数多、样本容量小的情况下。本文则给出了几类改进的偏最小二乘回归方法,并通过实例说明了改进的方法在预测精度方面的优越性
本文分为四部分。第一章绪论,介绍了PLS的发展背景及近几年对PLS改进的研究情况。第二章讨论了通过加权的方法对普通PLS进行改进,并通过实例分析说明了改进的PLS方法可以提高模型的预测精度。第三章则根据双重筛选变量选择方法对多因变量的偏最...
【英文摘要】
Partial least squares regression (PLS) is a new multiple statistic data analytical method, it is produced from chemistry field. The outstanding characteristic of PLS is that it can make the multiple linear regression analysis, the principal components analysis and the canonical correlation analysis combined. In the same arithmetic, it can implement modeling, predigesting the data structure and analyzing of the correlation between two gropes of variables at the same time. It brings huge advantage to the mult...