1.8. 交叉分解
交叉分解模块主要包含两个算法族: 偏最小二乘法(PLS)和典型相关分析(CCA)。
这些算法族具有发现两个多元数据集之间的线性关系的用途: fit
method (拟合方法)的参数 X
和 Y
都是 2 维数组。
交叉分解算法能够找到两个矩阵 (X 和 Y) 的基础关系。它们是对在两个空间的协方差结构进行建模的隐变量方法。它们将尝试在X空间中找到多维方向,该方向能够解释Y空间中最大多维方差方向。 PLS回归特别适用于当预测变量矩阵具有比观测值更多的变量以及当X值存在多重共线性时。相比之下,在这些情况下,标准回归将失败。
包含在此模块中的类有:PLSRegression
, PLSCanonical
, CCA
, PLSSVD
参考资料:
示例:
朴素贝叶斯方法是基于贝叶斯定理的一组有监督学习算法,即“简单”地假设每对特征之间相互独立。 给定一个类别 和一个从 到 的相关的特征向量, 贝叶斯定理阐述了以下关系:使用简单(naive) ...