关于机器学习:机器学习公式推导与代码实现sklearn机器学习库

34次阅读

共计 1597 个字符,预计需要花费 4 分钟才能阅读完成。

一.scikit-learn 概述

1.sklearn 模型

  sklearn 全称是 scikit-learn,它是一个基于 Python 的机器学习类库,次要建设在 NumPy、Pandas、SciPy 和 Matplotlib 等类库之上,基本上笼罩了常见了分类、回归、聚类、降维、模型抉择和预处理模块。

2.sklearn 源码

下图是 sklearn 在 GitHub 上的源代码,编程语言次要包含:91.4% 的 Python,6.5% 的 Cython,1.3% 的 C ++ 和 0.8% 的 Other。如下所示:

二. 模型抉择和预处理

1. 模型抉择
解析:网格搜寻,穿插验证
2. 预处理
解析:评估指标,数据预处理

三. 有监督学习模型

  能够将有监督模型分为生成式模型和判别式模型,常见的生成式模型包含奢侈贝叶斯、HMM 和隐含狄利克雷调配 (LDA),其它的根本都是判别式模型。
1. 线性模型
解析:线性回归,对数几率回归,LASSO 回归,Ridge 回归,线性判别分析 (LDA)
2.${k}$ 近邻
3. 决策树
解析:ID3,C4.5,CART
4. 神经网络
解析:感知机,神经网络
5. 反对向量机
解析:线性可分,近似线性可分,线性不可分
6. 集成模型
(1)Boosting
解析:AdaBoost,GBDT,XGBoost,LightGBM,CatBoost
(2)Bagging
解析:随机森林

四. 无监督学习模型

1. 聚类
解析:$k$ 均值聚类,档次聚类,谱聚类
2. 降维
解析:主成分剖析(PCA),奇怪值合成(SVD)

五. 概率模型

1. 最大信息熵模型
2. 贝叶斯概率模型
解析:奢侈贝叶斯,贝叶斯网络
3. 冀望最大化 (EM) 算法
4. 概率图模型
解析:隐马尔科夫模型(HMM),条件随机场(CRF)
5. 马尔可夫链蒙特卡洛(MCMC)

参考文献:
[1]scikit-learn:https://scikit-learn.org/stable/
[2]scikit-learn(sklearn)官网文档中文版:https://sklearn.apachecn.org/… 官网文档中文版
[3]scikit-learn 装置:https://scikit-learn.org/stab…
[4]scikit-learn 用户指南:https://scikit-learn.org/stab…
[5]scikit-learn API 参考:https://scikit-learn.org/stab…
[6]scikit-learn 例子:https://scikit-learn.org/stab…
[7]scikit-learn 博客:https://blog.scikit-learn.org/
[8]scikit-learn 教程:https://scikit-learn.org/stab…
[9]scikit-learn FAQ:https://scikit-learn.org/stab…
[10]scikit-learn GitHub:https://github.com/scikit-lea…
[11]scikit-learn 不同版本文档:https://scikit-learn.org/dev/…
[12]scikit-learn wiki:https://github.com/scikit-lea…
[13]scikit-learn 版本更新日志:https://scikit-learn.org/stab…
[14]scikit-learn 开发指南:https://scikit-learn.org/dev/…
[15]scikit-learn 相干类库:https://scikit-learn.org/stab…
[16]Hugging Face:https://huggingface.co/
[17]《机器学习:公式推导与代码实现》

本文由 mdnice 多平台公布

正文完
 0