比特派最新版app下载|sklearn中文
scikit-learn中文社区
scikit-learn中文社区
安装
用户指南
API
案例
更多
入门
教程
更新日志
词汇表
常见问题
交流群
scikit-learn
Machine Learning in Python
入门
0.23版本的发布要点
GitHub
交流微信群二维码
简单有效的工具进行预测数据分析
每个人都可以访问,并且可以在各种情况下重用
基于NumPy,SciPy和matplotlib构建
开源,可商业使用-BSD许可证
分类
标识对象所属的类别。
应用范围: 垃圾邮件检测,图像识别。
算法:
SVM
最近邻
随机森林
更多...
Examples
回归
预测与对象关联的连续值属性。
应用范围: 药物反应,股票价格。
算法:
SVR
最近邻
随机森林
更多...
Examples
聚类
自动将相似对象归为一组。
应用: 客户细分,分组实验成果。
算法:
K-均值
谱聚类
MeanShift
更多...
Examples
降维
减少要考虑的随机变量的数量。
应用: 可视化,提高效率。
算法:
K-均值
特征选择
非负矩阵分解
更多...
Examples
模型选择
比较,验证和选择参数和模型。
应用: 通过参数调整改进精度。
算法:
网格搜索
交叉验证
指标
更多...
Examples
预处理
特征提取和归一化。
应用程序: 转换输入数据,例如文本,以供机器学习算法使用。
算法:
预处理
特征提取
更多...
Examples
新闻
正在开发中的版本:
更新日志 (Changelog)
2020年8月. scikit-learn 0.23.2 可供下载 (更新日志).
2020年5月. scikit-learn 0.23.1 可供下载 (更新日志).
2020年5月. scikit-learn 0.23.0 可供下载 (更新日志).
Scikit-learn from 0.23 要求 Python 3.6 或更高版本.
2020年3月. scikit-learn 0.22.2 可供下载 (更新日志).
2020年1月. scikit-learn 0.22.1 可供下载 (更新日志).
2019年12月. scikit-learn 0.22 可供下载 (更新日志 and 发布亮点).
Scikit-learn from 0.21 要求 Python 3.5 或更高版本.
2019年7月. scikit-learn 0.21.3 (Changelog) and 0.20.4 (更新日志) 可供下载.
2019年5月. scikit-learn 0.21.0 to 0.21.2 可供下载 (更新日志).
关于
关于我们: CDA数据科学研究院
赞助支持: CDA考试认证中心
客服电话: +86 4000-51-9191
邮箱: service@cda.cn
关注我们
"Scikit-learn 中文文档由CDA数据科学研究院翻译,扫码关注获取更多信息。"
Copyright © 2015-2020, CDA数据科学研究院 版权所有 京ICP备11001960号-13
sklearn
sklearn
sklearn
sklearn 中文文档
目录
作者
整理
校招巴士
安装 scikit-learn
1. 监督学习
1.0 监督学习
1.1. 广义线性模型
1.2. 线性和二次判别分析
1.3. 内核岭回归
1.4. 支持向量机
1.5. 随机梯度下降
1.6. 最近邻
1.7. 高斯过程
1.8. 交叉分解
1.9. 朴素贝叶斯
1.10. 决策树
1.11. 集成方法
1.12. 多类和多标签算法
1.13. 特征选择
1.14. 半监督学习
1.15. 等式回归
1.16. 概率校准
1.17. 神经网络模型(有监督)
2. 无监督学习
2.0 无监督学习
2.1. 高斯混合模型
2.2. 流形学习
2.3. 聚类
2.4. 双聚类
2.5. 分解成分中的信号(矩阵分解问题)
2.6. 协方差估计
2.7. 新奇和异常值检测
2.8. 密度估计
2.9. 神经网络模型(无监督)
3. 模型选择和评估
3.0 模型选择和评估
3.1. 交叉验证:评估估算器的表现
3.2. 调整估计器的超参数
3.3. 模型评估: 量化预测的质量
3.4. 模型持久化
3.5. 验证曲线: 绘制分数以评估模型
4. 检验
4.0 检验
4.1. 部分依赖图
5. 数据集转换
5.0 数据集转换
5.1. Pipeline(管道)和 FeatureUnion(特征联合): 合并的评估器
5.2. 特征提取
5.3 预处理数据
5.4 缺失值插补
5.5. 无监督降维
5.6. 随机投影
5.7. 内核近似
5.8. 成对的矩阵, 类别和核函数
5.9. 预测目标
6. 数据集加载工具
6.0 数据集加载工具
6.1. 通用数据集 API
6.2. 玩具数据集
6.3 真实世界中的数据集
6.4. 样本生成器
6.5. 加载其他数据集
7. 使用scikit-learn计算
7.0 使用scikit-learn计算
7.1. 大规模计算的策略: 更大量的数据
7.2. 计算性能
7.3. 并行性、资源管理和配置
教程
使用 scikit-learn 介绍机器学习
关于科学数据处理的统计学习教程
关于科学数据处理的统计学习教程
机器学习: scikit-learn 中的设置以及预估对象
监督学习:从高维观察预测输出变量
模型选择:选择估计量及其参数
无监督学习: 寻求数据表示
把它们放在一起
寻求帮助
处理文本数据
选择正确的评估器(estimator.md
外部资源,视频和谈话
API 参考
常见问题
时光轴
sklearn
Docs »
sklearn 中文文档
sklearn 简介
scikit-learn 是基于 Python 语言的机器学习工具
简单高效的数据挖掘和数据分析工具
可供大家在各种环境中重复使用
建立在 NumPy ,SciPy 和 matplotlib 上
开源,可商业使用 - BSD许可证
点击下载OpenCV最新中文官方文档pdf版
目录
安装 scikit-learn
用户指南
1. 监督学习
1.1. 广义线性模型
1.2. 线性和二次判别分析
1.3. 内核岭回归
1.4. 支持向量机
1.5. 随机梯度下降
1.6. 最近邻
1.7. 高斯过程
1.8. 交叉分解
1.9. 朴素贝叶斯
1.10. 决策树
1.11. 集成方法
1.12. 多类和多标签算法
1.13. 特征选择
1.14. 半监督学习
1.15. 等式回归
1.16. 概率校准
1.17. 神经网络模型(有监督)
2. 无监督学习
2.1. 高斯混合模型
2.2. 流形学习
2.3. 聚类
2.4. 双聚类
2.5. 分解成分中的信号(矩阵分解问题)
2.6. 协方差估计
2.7. 新奇和异常值检测
2.8. 密度估计
2.9. 神经网络模型(无监督)
3. 模型选择和评估
3.1. 交叉验证:评估估算器的表现
3.2. 调整估计器的超参数
3.3. 模型评估: 量化预测的质量
3.4. 模型持久化
3.5. 验证曲线: 绘制分数以评估模型
4. 检验
4.1. 部分依赖图
5. 数据集转换
5.1. Pipeline(管道)和 FeatureUnion(特征联合): 合并的评估器
5.2. 特征提取
5.3 预处理数据
5.4 缺失值插补
5.5. 无监督降维
5.6. 随机投影
5.7. 内核近似
5.8. 成对的矩阵, 类别和核函数
5.9. 预测目标 (y) 的转换
6. 数据集加载工具
6.1. 通用数据集 API
6.2. 玩具数据集
6.3 真实世界中的数据集
6.4. 样本生成器
6.5. 加载其他数据集
7. 使用scikit-learn计算
7.1. 大规模计算的策略: 更大量的数据
7.2. 计算性能
7.3. 并行性、资源管理和配置
教程
使用 scikit-learn 介绍机器学习
关于科学数据处理的统计学习教程
机器学习: scikit-learn 中的设置以及预估对象
监督学习:从高维观察预测输出变量
模型选择:选择估计量及其参数
无监督学习: 寻求数据表示
把它们放在一起
寻求帮助
处理文本数据
选择正确的评估器(estimator/)
外部资源,视频和谈话
API 参考
常见问题
时光轴
作者
sklearn-doc-zh:https://github.com/apachecn/sklearn-doc-zh
整理
http://scikitlearn.com.cn/
校招巴士
校招巴士
校招巴士网站一个专注于大学生校招求职的平台!旨在分享互联网大厂内推、校招资讯、面经笔经、职场干货、简历技巧等,助力百万大学生校招求职!
Next
sklearn PythonOK 协议:CC BY-NC-SA 4.0
Built with MkDocs using a theme provided by Read the Docs.
Next »
1.13 特征选择-scikit-learn中文社区
1.13 特征选择-scikit-learn中文社区
安装
用户指南
API
案例
更多
入门
教程
更新日志
词汇表
常见问题
交流群
Toggle Menu
Prev
Up
Next
CDA数据科学研究院 提供翻译支持
1.13 特征选择
1.13.1 移除低方差特征
1.13.2 单变量特征选择
1.13.3 递归特征消除
1.13.4 基于SelectFromModel的特征选择
1.13.5 特征选择作为pipeline一部分
1.13 特征选择¶
sklearn.feature_selection中的类可以用于样本集的特征选择/降维,既可以提高估计器的精度得分,也可以提高它们在非常高维数据集上的性能。
1.13.1 移除低方差特征
方差阈值VarianceThreshold 是特征选择的一种简单的基本方法。它删除了所有方差不满足某些阈值的特征。默认情况下,它删除所有零方差特征,即在所有样本中具有相同值的特征。
例如,假设我们有一个具有布尔特征的数据集,并且我们想要移除那些在整个数据集中特征值为0或者为1的比例超过80%的特征。布尔特征是伯努利(Bernoulli)随机变量,并给出了这些变量的方差:
因此,我们可以使用阈值.8 * ( 1 - .8)进行选择:
>>> from sklearn.feature_selection import VarianceThreshold>>> X = [[0, 0, 1], [0, 1, 0], [1, 0, 0], [0, 1, 1], [0, 1, 0], [0, 1, 1]]>>> sel = VarianceThreshold(threshold=(.8 * (1 - .8)))>>> sel.fit_transform(X)array([[0, 1], [1, 0], [0, 0], [1, 1], [1, 0], [1, 1]])
正如预期的那样,VarianceThreshold删除了第一列,该列包含一个0的概率是 。
1.13.2 单变量特征选择
单变量特征选择是通过基于单变量统计检验来选择最优特征实现的。它可以看作是对估计器的预处理步骤。Scikit-learn将特征选择的程序作为实现了transform方法的对象:
SelectKBest 移除那些除了评分最高的 K 个特征之外的所有特征SelectPercentile 移除除了用户指定的最高得分百分比之外的所有特征对每个特征使用通用的单变量统计检验:假正率 SelectFpr, 伪发现率SelectFdr, 或者族系误差SelectFwe。GenericUnivariateSelect允许使用可配置策略执行单变量特征选择。它允许使用超参数搜索估计器来选择最佳的单变量选择策略。
例如,我们可以对样本执行检验,只检索两个最好的特征,如下所示:
>>> from sklearn.datasets import load_iris>>> from sklearn.feature_selection import SelectKBest>>> from sklearn.feature_selection import chi2>>> X, y = load_iris(return_X_y=True)>>> X.shape(150, 4)>>> X_new = SelectKBest(chi2, k=2).fit_transform(X, y)>>> X_new.shape(150, 2)
这些对象以一个得分函数作为输入,该函数返回单变量分数和p值(或仅用于 SelectKBest 和SelectPercentile):
对于回归: f_regression, mutual_info_regression对于分类: chi2, f_classif, mutual_info_classif
基于F检验的方法估计了两个随机变量之间的线性依赖程度。另一方面,互换信息方法(mutual information methods )可以捕获任何类型的统计相关性,但由于非参数性,它们需要更多的样本来精确估计。
稀疏数据的特征选择
如果您使用稀疏数据(即数据被表示为稀疏矩阵),则 chi2, mutual_info_regression, mutual_info_classif 将处理这些数据,而不会使其稠密。
警告:不要使用一个回归评分函数来处理分类问题,你会得到无用的结果。
示例
单变量特征选择F检验与互信息比较
1.13.3 递归特征消除
给定一个外部的估计器,可以对特征赋予一定的权重(比如,线性模型的相关系数),递归特征消除(RFE)通过考虑越来越小的特征集来递归的选择特征。 首先,估计器在初始的特征集合上训练并且通过 coef_属性或者feature_importances_获取每一个特征的重要性。 然后,从当前的特征集合中移除最不重要的特征。在特征集合上不断的重复递归这个步骤,直到最终达到所需要的特征数量为止。
RFECV在一个交叉验证的循环中执行 RFE 来找到最优的特征数量。
示例
递归特征消除: 数字分类任务中像素相关性的递归特征消除实例.带交叉验证的递归特征消除:一个自动调整交叉验证特征数的递归特征消除示例.
1.13.4 基于SelectFromModel的特征选择
SelectFromModel是一个元转换器(meta-transformer),它可以与任何具有 coef_属性或feature_importances_属性的估值器一起使用。如果相应的coef_或 feature_importances_低于所提供的阈值参数,则这些特征被视为不重要并被删除。除了指定在数值上的阈值外,还可以通过给定字符串参数来使用内置的启发式方法找到一个合适的阈值。可用的启发式方法是“mean”, “median” 和浮点倍数,如 “0.1*mean”。结合阈值标准,可以使用max_features参数来设置要选择的特征数量的限制。
关于如何使用它的例子,请参阅下面的章节。
示例
使用SelectFromModel和LassoCV进行特征选择: 从 Boston 数据中自动选择最重要两个特征而不需要提前得知这一信息。
1.13.4.1 基于L1的特征选择
用L1范数惩罚的线性模型具有稀疏解:它们的许多估计系数为零。当目标是降低数据的维数以便与另一个分类器一起使用时,它们可以与feature_selection.SelectFromModel一起使用来选择非零系数。具体而言,可用于此目的的稀疏估计器对回归而言是linear_model.Lasso, 以及用于分类的linear_model.LogisticRegression 和svm.LinearSVC。
>>> from sklearn.svm import LinearSVC>>> from sklearn.datasets import load_iris>>> from sklearn.feature_selection import SelectFromModel>>> X, y = load_iris(return_X_y=True)>>> X.shape(150, 4)>>> lsvc = LinearSVC(C=0.01, penalty="l1", dual=False).fit(X, y)>>> model = SelectFromModel(lsvc, prefit=True)>>> X_new = model.transform(X)>>> X_new.shape(150, 3)
利用SVM和Logistic回归,参数C控制稀疏性:C越小,选择的特征越少。对于Lasso,alpha参数越高,所选择的特征就越少。
示例
基于稀疏特征的文本文档分类: 基于L1特征选择的文档分类算法比较.
L1-recovery和压缩感知
当选择了正确的 alpha 值以后, Lasso 可以仅通过少量观察点便恢复完整的非零特征, 假设特定的条件可以被满足的话。特别的,数据量需要 “足够大” ,不然 L1 模型的表现将随机。 “足够大” 的定义取决于非零系数的个数、特征数量的对数值、噪音的数量、非零系数的最小绝对值、 以及设计矩阵(design maxtrix) X 的结构。此外, 特征矩阵必须表现出特定的性质,如数据不能太相关。
对于非零系数的恢复, 如何选择 alpha 值没有通用的规则。alpha 值可以通过交叉验证来确定( LassoCV 或者 LassoLarsCV ),尽管这可能会导致欠惩罚(under-penalized)的模型:包括少量的无关变量对于预测值来说并非致命的。相反的, BIC( LassoLarsIC )倾向于给定高的 alpha 值。
参考文献 Richard G. Baraniuk “Compressive Sensing”, IEEE Signal Processing Magazine [120] July 2007 http://dsp.rice.edu/sites/dsp.rice.edu/files/cs/baraniukCSlecture07.pdf
1.13.4.2 基于树的特征选择
基于树的估计器(参看 sklearn.tree 模块和在 sklearn.ensemble 模块中的树的森林) 可以用来计算基于不存度的特征重要性,然后可以消除不相关的特征(当与 sklearn.feature_selection.SelectFromModel 等元转换器一同使用时):
>>> from sklearn.ensemble import ExtraTreesClassifier>>> from sklearn.datasets import load_iris>>> from sklearn.feature_selection import SelectFromModel>>> X, y = load_iris(return_X_y=True)>>> X.shape(150, 4)>>> clf = ExtraTreesClassifier(n_estimators=50)>>> clf = clf.fit(X, y)>>> clf.feature_importances_ array([ 0.04..., 0.05..., 0.4..., 0.4...])>>> model = SelectFromModel(clf, prefit=True)>>> X_new = model.transform(X)>>> X_new.shape (150, 2)
示例
树森林的特征重要性: 在合成数据上恢复有用特征的示例。基于平行树的森林的像素重要性: 在人脸识别数据上的示例。
1.13.5 特征选择作为pipeline一部分
特征选择通常在实际的学习之前用来做预处理。在 scikit-learn 中推荐的方式是使用 :sklearn.pipeline.Pipeline:
clf = Pipeline([ ('feature_selection', SelectFromModel(LinearSVC(penalty="l1"))), ('classification', RandomForestClassifier())])clf.fit(X, y)
在这段代码中,我们利用 sklearn.svm.LinearSVC 和 sklearn.feature_selection.SelectFromModel 来评估特征的重要性并且选择出最相关的特征。 然后,在转化后的输出中使用一个 sklearn.ensemble.RandomForestClassifier 分类器,比如只使用相关的特征。你也可以使用其他特征选择的方法和可以提供评估特征重要性的分类器来执行相似的操作。 请查阅 sklearn.pipeline.Pipeline 来了解更多的实例。
© 2007 - 2020, scikit-learn developers (BSD License).
scikit-learn (sklearn) 官方文档中文版 - sklearn
scikit-learn (sklearn) 官方文档中文版 - sklearn
sklearn
sklearn 中文文档
安装 scikit-learn
1. 监督学习
1.0 监督学习
1.1. 广义线性模型
1.2. 线性和二次判别分析
1.3. 内核岭回归
1.4. 支持向量机
1.5. 随机梯度下降
1.6. 最近邻
1.7. 高斯过程
1.8. 交叉分解
1.9. 朴素贝叶斯
1.10. 决策树
1.11. 集成方法
1.12. 多类和多标签算法
1.13. 特征选择
1.14. 半监督学习
1.15. 等式回归
1.16. 概率校准
1.17. 神经网络模型(有监督)
2. 无监督学习
2.0 无监督学习
2.1. 高斯混合模型
2.2. 流形学习
2.3. 聚类
2.4. 双聚类
2.5. 分解成分中的信号(矩阵分解问题)
2.6. 协方差估计
2.7. 新奇和异常值检测
2.8. 密度估计
2.9. 神经网络模型(无监督)
3. 模型选择和评估
3.0 模型选择和评估
3.1. 交叉验证:评估估算器的表现
3.2. 调整估计器的超参数
3.3. 模型评估: 量化预测的质量
3.4. 模型持久化
3.5. 验证曲线: 绘制分数以评估模型
4. 检验
4.0 检验
4.1. 部分依赖图
5. 数据集转换
5.0 数据集转换
5.1. Pipeline(管道)和 FeatureUnion(特征联合): 合并的评估器
5.2. 特征提取
5.3 预处理数据
5.4 缺失值插补
5.5. 无监督降维
5.6. 随机投影
5.7. 内核近似
5.8. 成对的矩阵, 类别和核函数
5.9. 预测目标
6. 数据集加载工具
6.0 数据集加载工具
6.1. 通用数据集 API
6.2. 玩具数据集
6.3 真实世界中的数据集
6.4. 样本生成器
6.5. 加载其他数据集
7. 使用scikit-learn计算
7.0 使用scikit-learn计算
7.1. 大规模计算的策略: 更大量的数据
7.2. 计算性能
7.3. 并行性、资源管理和配置
教程
使用 scikit-learn 介绍机器学习
关于科学数据处理的统计学习教程
关于科学数据处理的统计学习教程
机器学习: scikit-learn 中的设置以及预估对象
监督学习:从高维观察预测输出变量
模型选择:选择估计量及其参数
无监督学习: 寻求数据表示
把它们放在一起
寻求帮助
处理文本数据
选择正确的评估器(estimator.md
外部资源,视频和谈话
API 参考
常见问题
时光轴
sklearn
Docs »
scikit-learn (sklearn) 官方文档中文版
scikit-learn (sklearn) 官方文档中文版
scikit-learn 是基于 Python 语言的机器学习工具
简单高效的数据挖掘和数据分析工具
可供大家在各种环境中重复使用
建立在 NumPy ,SciPy 和 matplotlib 上
开源,可商业使用 - BSD许可证
维护地址
Github
在线阅读
EPUB 格式
目录
安装 scikit-learn
用户指南
1. 监督学习
1.1. 广义线性模型
1.2. 线性和二次判别分析
1.3. 内核岭回归
1.4. 支持向量机
1.5. 随机梯度下降
1.6. 最近邻
1.7. 高斯过程
1.8. 交叉分解
1.9. 朴素贝叶斯
1.10. 决策树
1.11. 集成方法
1.12. 多类和多标签算法
1.13. 特征选择
1.14. 半监督学习
1.15. 等式回归
1.16. 概率校准
1.17. 神经网络模型(有监督)
2. 无监督学习
2.1. 高斯混合模型
2.2. 流形学习
2.3. 聚类
2.4. 双聚类
2.5. 分解成分中的信号(矩阵分解问题)
2.6. 协方差估计
2.7. 新奇和异常值检测
2.8. 密度估计
2.9. 神经网络模型(无监督)
3. 模型选择和评估
3.1. 交叉验证:评估估算器的表现
3.2. 调整估计器的超参数
3.3. 模型评估: 量化预测的质量
3.4. 模型持久化
3.5. 验证曲线: 绘制分数以评估模型
4. 检验
4.1. 部分依赖图
5. 数据集转换
5.1. Pipeline(管道)和 FeatureUnion(特征联合): 合并的评估器
5.2. 特征提取
5.3 预处理数据
5.4 缺失值插补
5.5. 无监督降维
5.6. 随机投影
5.7. 内核近似
5.8. 成对的矩阵, 类别和核函数
5.9. 预测目标 (y) 的转换
6. 数据集加载工具
6.1. 通用数据集 API
6.2. 玩具数据集
6.3 真实世界中的数据集
6.4. 样本生成器
6.5. 加载其他数据集
7. 使用scikit-learn计算
7.1. 大规模计算的策略: 更大量的数据
7.2. 计算性能
7.3. 并行性、资源管理和配置
教程
使用 scikit-learn 介绍机器学习
关于科学数据处理的统计学习教程
机器学习: scikit-learn 中的设置以及预估对象
监督学习:从高维观察预测输出变量
模型选择:选择估计量及其参数
无监督学习: 寻求数据表示
把它们放在一起
寻求帮助
处理文本数据
选择正确的评估器(estimator.md)
外部资源,视频和谈话
API 参考
常见问题
时光轴
贡献指南
项目当前处于校对阶段,请查看贡献指南,并在整体进度中领取任务。
请您勇敢地去翻译和改进翻译。虽然我们追求卓越,但我们并不要求您做到十全十美,因此请不要担心因为翻译上犯错——在大部分情况下,我们的服务器已经记录所有的翻译,因此您不必担心会因为您的失误遭到无法挽回的破坏。(改编自维基百科)
项目负责人
格式: GitHub + QQ
@mahaoyang:992635910
@loopyme:3322728009
飞龙:562826179
片刻:529815144
-- 负责人要求: (欢迎一起为 sklearn 中文版本 做贡献)
热爱开源,喜欢装逼
长期使用 sklearn(至少0.5年) + 提交Pull Requests>=3
能够有时间及时优化页面 bug 和用户 issues
试用期: 2个月
欢迎联系: 片刻 529815144
项目协议
以各项目协议为准。
ApacheCN 账号下没有协议的项目,一律视为 CC BY-NC-SA 4.0。
建议反馈
在我们的 apachecn/pytorch-doc-zh github 上提 issue.
发邮件到 Email: apachecn@163.com.
在我们的 QQ群-搜索: 交流方式 中联系群主/管理员即可.
赞助我们
sklearn PythonOK 协议:CC BY-NC-SA 4.0
Built with MkDocs using a theme provided by Read the Docs.
now loading...
scikit-learn: machine learning in Python — scikit-learn 1.4.1 documentation
scikit-learn: machine learning in Python — scikit-learn 1.4.1 documentation
Install
User Guide
API
Examples
Community
Getting Started
Tutorial
What's new
Glossary
Development
FAQ
Support
Related packages
Roadmap
Governance
About us
GitHub
Other Versions and Download
More
Getting Started
Tutorial
What's new
Glossary
Development
FAQ
Support
Related packages
Roadmap
Governance
About us
GitHub
Other Versions and Download
scikit-learn
Machine Learning in Python
Getting Started
Release Highlights for 1.4
GitHub
Simple and efficient tools for predictive data analysis
Accessible to everybody, and reusable in various contexts
Built on NumPy, SciPy, and matplotlib
Open source, commercially usable - BSD license
Classification
Identifying which category an object belongs to.
Applications: Spam detection, image recognition.
Algorithms:
Gradient boosting,
nearest neighbors,
random forest,
logistic regression,
and more...
Examples
Regression
Predicting a continuous-valued attribute associated with an object.
Applications: Drug response, Stock prices.
Algorithms:
Gradient boosting,
nearest neighbors,
random forest,
ridge,
and more...
Examples
Clustering
Automatic grouping of similar objects into sets.
Applications: Customer segmentation, Grouping experiment outcomes
Algorithms:
k-Means,
HDBSCAN,
hierarchical
clustering,
and more...
Examples
Dimensionality reduction
Reducing the number of random variables to consider.
Applications: Visualization, Increased efficiency
Algorithms:
PCA,
feature selection,
non-negative matrix factorization,
and more...
Examples
Model selection
Comparing, validating and choosing parameters and models.
Applications: Improved accuracy via parameter tuning
Algorithms:
grid search,
cross validation,
metrics,
and more...
Examples
Preprocessing
Feature extraction and normalization.
Applications: Transforming input data such as text for use with machine learning algorithms.
Algorithms:
preprocessing,
feature extraction,
and more...
Examples
News
On-going development:
scikit-learn 1.5 (Changelog)
February 2024. scikit-learn 1.4.1.post1 is available for download (Changelog).
January 2024. scikit-learn 1.4.0 is available for download (Changelog).
October 2023. scikit-learn 1.3.2 is available for download (Changelog).
September 2023. scikit-learn 1.3.1 is available for download (Changelog).
June 2023. scikit-learn 1.3.0 is available for download (Changelog).
All releases:
What's new (Changelog)
Community
About us: See authors and contributing
More Machine Learning: Find related projects
Questions? See FAQ and stackoverflow
Subscribe to the mailing list
Gitter: gitter.im/scikit-learn
Blog: blog.scikit-learn.org
Logos & Branding: logos and branding
Calendar: calendar
Twitter: @scikit_learn
LinkedIn: linkedin/scikit-learn
YouTube: youtube.com/scikit-learn
Facebook: @scikitlearnofficial
Instagram: @scikitlearnofficial
TikTok: @scikit.learn
Communication on all channels should respect PSF's code of conduct.
Help us, donate!
Cite us!
Who uses scikit-learn?
"We use scikit-learn to support leading-edge basic research [...]"
"I think it's the most well-designed ML package I've seen so far."
"scikit-learn's ease-of-use, performance and overall variety of algorithms implemented has proved invaluable [...]."
"The great benefit of scikit-learn is its fast learning curve [...]"
"It allows us to do AWesome stuff we would not otherwise accomplish"
"scikit-learn makes doing advanced analysis in Python accessible to anyone."
More testimonials
scikit-learn development and maintenance are financially supported by
scikit-learn (sklearn) 官方文档中文版 - 知乎
scikit-learn (sklearn) 官方文档中文版 - 知乎切换模式写文章登录/注册scikit-learn (sklearn) 官方文档中文版AI算法与图像处理作者:AI算法与图像处理欢迎置顶或星标公众号本人最近在做图像的特征聚类,搞了一段时间,从理论到实践,踩了不少坑,然后我发现了这个好东西(scikit-learn),和大家分享一下,希望能够帮大家提高效率。什么是scikit-learnscikit-learn 是基于 Python 语言的机器学习工具。简单高效的数据挖掘和数据分析工具可供大家在各种环境中重复使用建立在 NumPy ,SciPy 和 matplotlib 上开源,可商业使用 - BSD许可证scikit-learn都有什么功能Scikit-learn的基本功能主要被分为六大部分:分类,回归,聚类,数据降维,模型选择和数据预处理。scikit-learn哪里可以获取http://sklearn.apachecn.org/#/https://scikit-learn.org/stable/上面是中文的,下面是英文的可以根据自己的喜好来选择,但是中文版的代码我不知道为啥我自己打不开但英文的链接里面的都会附有代码的实例当然皇天不负有心人,我也找到目前这个翻译团队正在更新的中文文档以及相应打代码链接,收藏起来没错的https://github.com/apachecn/scikit-learn-doc-zh看个例子吧——对数据进行聚类只需输入数据,定义簇数n_cluster,后面random_state都可以设置为默认的便能够实现聚类,开发的效率非常的高。还有详细的算法讲解和比较http://weixin.qq.com/r/Wy7t9WPEzD6zrSeW93tJ (二维码自动识别)发布于 2018-12-19 00:09人工智能文档sklearn深度学习(Deep Learning)赞同 988 条评论分享喜欢收藏申请
你需要的Scikit-learn中文文档:步入机器学习的完美实践教程 - 知乎
你需要的Scikit-learn中文文档:步入机器学习的完美实践教程 - 知乎首发于机器之心切换模式写文章登录/注册你需要的Scikit-learn中文文档:步入机器学习的完美实践教程机器之心数学等 2 个话题下的优秀答主Scikit-learn 中文文档已经由 ApacheCN 完成校对,这对于国内机器学习用户有非常大的帮助。该文档自 2017 年 11 月初步完成校对,目前很多细节都已经得到完善。该中文文档包含了分类、回归、聚类和降维等经典机器学习任务,并提供了完整的使用教程与 API 注释。入门读者也可以借此文档与教程从实践出发进入数据科学与机器学习的领域。中文文档地址:http://sklearn.apachecn.orgScikit-learn 是基于 Python 的开源机器学习库,它基于 NumPy 和 SciPy 等科学计算库,并支持支持向量机、随即森林、梯度提升树、K 均值聚类等学习算法。Scikit-learn 目前主要由社区成员自发进行维护,且专注于构建机器学习领域内经广泛验证的成熟算法。Scikit-learn 项目最早为数据科学家 David Cournapeau 于 2007 年发起的 scikits.learn 项目,且 Scikit 的名字可视为 SciPy Toolkit,即 SciPy 的第三方扩展。Scikit-learn 大部分都是由 Python 构建,但还是有很多核心算法是由 Cython 完成而实现更好的效果,例如支持向量机就是由 Cython 构建。在监督学习部分,Scikit-learn 提供了广义线性模型、支持向量机、最近邻算法、高斯过程、朴素贝叶斯、决策树和集成方法等算法教程,同时还介绍了特征选择、随即梯度下降算法、线性与二次判别分析等在监督学习中非常重要的概念。 除了监督学习,半监督学习中的标签传播算法和无监督学习中的聚类与降维算法都有非常多的教程。此外,在模型选择中,文档教程描述了交叉验证的使用、估计器超参数的调整、模型评估方法和模型持久化概念等。 数据预处理是机器学习非常重要的部分,我们可以使用归一化等方法大大降低前向传播与学习算法的计算复杂度,也可以利用缺失值插补和特征提取等方法增加数据的有效性。以下选取了 SVM 的部分使用教程,读者可借此了解 Scikit-learn 中文文档的组织形式与基本内容,更完整的内容前查看原文档。支持向量机 (SVMs) 可用于以下监督学习算法分类、回归和异常检测。支持向量机的优势在于:在高维空间中非常高效。 即使在数据维度比样本数量大的情况下仍然有效。在决策函数(称为支持向量)中使用训练集的子集,因此它也是高效利用内存的。通用性:不同的核函数 核函数 与特定的决策函数一一对应。支持向量机的缺点包括:如果特征数量比样本数量大得多,在选择核函数时要避免过拟合,而且正则化项是非常重要的。支持向量机不直接提供概率估计,这些都是使用昂贵的五次交叉验算计算的。在 scikit-learn 中,支持向量机提供 dense(numpy.ndarray , 可以通过 numpy.asarray 进行转换) 和 sparse(任何 scipy.sparse)样例向量作为输出。然而,要使用支持向量机来对 sparse 数据作预测,它必须已经拟合这样的数据。使用 C 代码的 numpy.ndarray (dense) 或者带有 dtype=float64 的 scipy.sparse.csr_matrix (sparse) 来优化性能。分类SVC、NuSVC 和 LinearSVC 能在数据集中实现多元分类:SVC 和 NuSVC 是相似的方法,但是接受稍许不同的参数设置并且有不同的数学方程。另一方面,LinearSVC 是另一个实现线性核函数的支持向量分类。记住 LinearSVC 不接受关键词 kernel,因为它被假设为线性的。它也缺少一些 SVC 和 NuSVC 的成员(members)比如 support_。和其他分类器一样,SVC、NuSVC 和 LinearSVC 将两个数组作为输入:[n_samples, n_features] 大小的数组 X 作为训练样本,[n_samples] 大小的数组 y 作为类别标签 (字符串或者整数):>>> from sklearn import svm
>>> X = [[0, 0], [1, 1]]
>>> y = [0, 1]
>>> clf = svm.SVC()
>>> clf.fit(X, y)
SVC(C=1.0, cache_size=200, class_weight=None, coef0=0.0,
decision_function_shape='ovr', degree=3, gamma='auto', kernel='rbf',
max_iter=-1, probability=False, random_state=None, shrinking=True,
tol=0.001, verbose=False)在拟合后, 这个模型可以用来预测新的值:>>> clf.predict([[2., 2.]])
array([1])SVMs 决策函数取决于训练集的一些子集, 称作支持向量. 这些支持向量的部分特性可以在 support_vectors_、support_和 n_support 找到:>>> # 获得支持向量
>>> clf.support_vectors_
array([[ 0., 0.],
[ 1., 1.]])
>>> # 获得支持向量的索引get indices of support vectors
>>> clf.support_
array([0, 1]...)
>>> # 为每一个类别获得支持向量的数量
>>> clf.n_support_
array([1, 1]...)
以上是 SVM 简单的介绍,这些内容都由 ApacheCN 翻自 Scikit-learn 。最后,感谢参与翻译文档的志愿者,正因为他们,开源社区才能有如此高质量的学习资料。编辑于 2018-04-06 23:57机器学习人工智能赞同 44312 条评论分享喜欢收藏申请转载文章被以下专栏收录机器之心关注人工智能学术和技
GitHub - apachecn/sklearn-doc-zh: :book: [译] scikit-learn(sklearn) 中文文档
GitHub - apachecn/sklearn-doc-zh: :book: [译] scikit-learn(sklearn) 中文文档
Skip to content
Toggle navigation
Sign in
Product
Actions
Automate any workflow
Packages
Host and manage packages
Security
Find and fix vulnerabilities
Codespaces
Instant dev environments
Copilot
Write better code with AI
Code review
Manage code changes
Issues
Plan and track work
Discussions
Collaborate outside of code
Explore
All features
Documentation
GitHub Skills
Blog
Solutions
For
Enterprise
Teams
Startups
Education
By Solution
CI/CD & Automation
DevOps
DevSecOps
Resources
Learning Pathways
White papers, Ebooks, Webinars
Customer Stories
Partners
Open Source
GitHub Sponsors
Fund open source developers
The ReadME Project
GitHub community articles
Repositories
Topics
Trending
Collections
Pricing
Search or jump to...
Search code, repositories, users, issues, pull requests...
Search
Clear
Search syntax tips
Provide feedback
We read every piece of feedback, and take your input very seriously.
Include my email address so I can be contacted
Cancel
Submit feedback
Saved searches
Use saved searches to filter your results more quickly
Name
Query
To see all available qualifiers, see our documentation.
Cancel
Create saved search
Sign in
Sign up
You signed in with another tab or window. Reload to refresh your session.
You signed out in another tab or window. Reload to refresh your session.
You switched accounts on another tab or window. Reload to refresh your session.
Dismiss alert
apachecn
/
sklearn-doc-zh
Public
Notifications
Fork
1.5k
Star
5k
[译] scikit-learn(sklearn) 中文文档
sklearn.apachecn.org
License
View license
5k
stars
1.5k
forks
Branches
Tags
Activity
Star
Notifications
Code
Issues
10
Pull requests
0
Discussions
Actions
Projects
0
Security
Insights
Additional navigation options
Code
Issues
Pull requests
Discussions
Actions
Projects
Security
Insights
apachecn/sklearn-doc-zh
This commit does not belong to any branch on this repository, and may belong to a fork outside of the repository.
masterBranchesTagsGo to fileCodeFolders and filesNameNameLast commit messageLast commit dateLatest commit History270 Commitsassetasset docsdocs img/logoimg/logo srcsrc .gitignore.gitignore .nojekyll.nojekyll 404.html404.html CONTRIBUTING.mdCONTRIBUTING.md DockerfileDockerfile LICENSELICENSE NAV.mdNAV.md README.mdREADME.md SUMMARY.mdSUMMARY.md ads.txtads.txt cover.mdcover.md index.htmlindex.html update.shupdate.sh View all filesRepository files navigationREADMELicensescikit-learn (sklearn) 官方文档中文版
sklearn 0.21.3 中文文档
sklearn 0.21.3 中文示例
sklearn 英文官网
介绍
sklearn (scikit-learn) 是基于 Python 语言的机器学习工具
简单高效的数据挖掘和数据分析工具
可供大家在各种环境中重复使用
建立在 NumPy ,SciPy 和 matplotlib 上
开源,可商业使用 - BSD许可证
组织构建[网站]
GitHub Pages(国外): https://sklearn.apachecn.org
Gitee Pages(国内): https://apachecn.gitee.io/sklearn-doc-zh
第三方站长[网站]
地址A: xxx (欢迎留言,我们完善补充)
其他补充
官方Github
EPUB 下载地址
ApacheCN 翻译校对兼职群 713436582
下载
Docker
docker pull apachecn0/sklearn-doc-zh
docker run -tid -p
# 访问 http://localhost:{port} 查看文档
PYPI
pip install sklearn-doc-zh
sklearn-doc-zh
# 访问 http://localhost:{port} 查看文档
NPM
npm install -g sklearn-doc-zh
sklearn-doc-zh
# 访问 http://localhost:{port} 查看文档
目录
安装 scikit-learn
用户指南
1. 监督学习
1.1. 广义线性模型
1.2. 线性和二次判别分析
1.3. 内核岭回归
1.4. 支持向量机
1.5. 随机梯度下降
1.6. 最近邻
1.7. 高斯过程
1.8. 交叉分解
1.9. 朴素贝叶斯
1.10. 决策树
1.11. 集成方法
1.12. 多类和多标签算法
1.13. 特征选择
1.14. 半监督学习
1.15. 等式回归
1.16. 概率校准
1.17. 神经网络模型(有监督)
2. 无监督学习
2.1. 高斯混合模型
2.2. 流形学习
2.3. 聚类
2.4. 双聚类
2.5. 分解成分中的信号(矩阵分解问题)
2.6. 协方差估计
2.7. 新奇和异常值检测
2.8. 密度估计
2.9. 神经网络模型(无监督)
3. 模型选择和评估
3.1. 交叉验证:评估估算器的表现
3.2. 调整估计器的超参数
3.3. 模型评估: 量化预测的质量
3.4. 模型持久化
3.5. 验证曲线: 绘制分数以评估模型
4. 检验
4.1. 部分依赖图
5. 数据集转换
5.1. Pipeline(管道)和 FeatureUnion(特征联合): 合并的评估器
5.2. 特征提取
5.3 预处理数据
5.4 缺失值插补
5.5. 无监督降维
5.6. 随机投影
5.7. 内核近似
5.8. 成对的矩阵, 类别和核函数
5.9. 预测目标 (y) 的转换
6. 数据集加载工具
6.1. 通用数据集 API
6.2. 玩具数据集
6.3 真实世界中的数据集
6.4. 样本生成器
6.5. 加载其他数据集
7. 使用scikit-learn计算
7.1. 大规模计算的策略: 更大量的数据
7.2. 计算性能
7.3. 并行性、资源管理和配置
教程
使用 scikit-learn 介绍机器学习
关于科学数据处理的统计学习教程
机器学习: scikit-learn 中的设置以及预估对象
监督学习:从高维观察预测输出变量
模型选择:选择估计量及其参数
无监督学习: 寻求数据表示
把它们放在一起
寻求帮助
处理文本数据
选择正确的评估器(estimator.md)
外部资源,视频和谈话
API 参考
常见问题
时光轴
历史版本
scikit-learn (sklearn) 0.19 官方文档中文版
scikit-learn (sklearn) 0.18 官方文档中文版
如何编译使用历史版本:
解压 0.19.x.zip 文件夹
将 master/img 的图片资源, 复制到 0.19.x 里面去
gitbook 正常编译过程,可以使用 sh run_website.sh
贡献指南
为了不断改进翻译质量,我们特此启动了【翻译、校对、笔记整理活动】,开设了多个校对项目。贡献者校对一章之后可以领取千字2~4元的奖励。进行中的校对活动请见活动列表。更多详情请联系飞龙(Q562826179,V:wizardforcel)。
DOCX:开放共享科研记录行动倡议
我们积极响应科研开源计划(DOCX)。如今开源不仅仅是开放源码,还包括数据集、模型、教程和实验记录。我们也在探讨其它类别的开源方案和协议。
希望大家了解这个倡议,把这个倡议与自己的兴趣点结合,做点力所能及的事情。每个人的微小的贡献,汇聚在一起就是整个开源生态。
项目负责人
格式: GitHub + QQ
第一期 (2017-09-29)
@那伊抹微笑
@片刻
@小瑶
第二期 (2019-06-29)
@N!no:1352899627
@mahaoyang:992635910
@loopyme:3322728009
飞龙:562826179
片刻:529815144
-- 负责人要求: (欢迎一起为 sklearn 中文版本 做贡献)
热爱开源,喜欢装逼
长期使用 sklearn(至少0.5年) + 提交Pull Requests>=3
能够有时间及时优化页面 bug 和用户 issues
试用期: 2个月
欢迎联系: 片刻 529815144
贡献者
【0.19.X】贡献者名单
建议反馈
在我们的 apachecn/pytorch-doc-zh github 上提 issue.
发邮件到 Email: apachecn@163.com.
在我们的 QQ群-搜索: 交流方式 中联系群主/管理员即可.
项目协议
最近有很多人联系我们,关于内容授权问题!
开源是指知识应该重在传播和迭代(而不是禁止别人转载)
不然你TM在GitHub开源,然后又说不让转载,你TM有病吧!
禁止商业化,符合协议规范,备注地址来源,重点: 不需要发邮件给我们申请
ApacheCN 账号下没有协议的项目,一律视为 CC BY-NC-SA 4.0。
温馨提示:
对于个人想自己copy一份再更新的人
我也是有这样的经历,但是这种激情维持不了几个月,就泄气了!
不仅浪费了你的心血,还浪费了更多人看到你的翻译成果!很可惜!你觉得呢?
个人的建议是: fork -> pull requests 到 https://github.com/apachecn/sklearn-doc-zh
那为什么要选择 ApacheCN 呢?
因为我们做翻译这事情是觉得开心和装逼,比较纯粹!
你如果喜欢,你可以来参与/甚至负责这个项目,没有任何学历和背景的限制
赞助我们
About
[译] scikit-learn(sklearn) 中文文档
sklearn.apachecn.org
Topics
python
documentation
machine-learning
scikit-learn
Resources
Readme
License
View license
Activity
Custom properties
Stars
5k
stars
Watchers
211
watching
Forks
1.5k
forks
Report repository
Releases
1
v0.19.x
Latest
Aug 4, 2019
Packages
0
No packages published
Contributors
19
+ 5 contributors
Languages
CSS
43.4%
JavaScript
34.6%
Python
9.9%
HTML
9.7%
Shell
2.3%
Dockerfile
0.1%
Footer
© 2024 GitHub, Inc.
Footer navigation
Terms
Privacy
Security
Status
Docs
Contact
Manage cookies
Do not share my personal information
You can’t perform that action at this time.
GitHub - Apache-CN/scikit-learn-doc-zh: scikit-learn(sklearn) 官方文档中文版
GitHub - Apache-CN/scikit-learn-doc-zh: scikit-learn(sklearn) 官方文档中文版
Skip to content
Toggle navigation
Sign in
Product
Actions
Automate any workflow
Packages
Host and manage packages
Security
Find and fix vulnerabilities
Codespaces
Instant dev environments
Copilot
Write better code with AI
Code review
Manage code changes
Issues
Plan and track work
Discussions
Collaborate outside of code
Explore
All features
Documentation
GitHub Skills
Blog
Solutions
For
Enterprise
Teams
Startups
Education
By Solution
CI/CD & Automation
DevOps
DevSecOps
Resources
Learning Pathways
White papers, Ebooks, Webinars
Customer Stories
Partners
Open Source
GitHub Sponsors
Fund open source developers
The ReadME Project
GitHub community articles
Repositories
Topics
Trending
Collections
Pricing
Search or jump to...
Search code, repositories, users, issues, pull requests...
Search
Clear
Search syntax tips
Provide feedback
We read every piece of feedback, and take your input very seriously.
Include my email address so I can be contacted
Cancel
Submit feedback
Saved searches
Use saved searches to filter your results more quickly
Name
Query
To see all available qualifiers, see our documentation.
Cancel
Create saved search
Sign in
Sign up
You signed in with another tab or window. Reload to refresh your session.
You signed out in another tab or window. Reload to refresh your session.
You switched accounts on another tab or window. Reload to refresh your session.
Dismiss alert
Apache-CN
/
scikit-learn-doc-zh
Public
forked from apachecn/sklearn-doc-zh
Notifications
Fork
0
Star
0
scikit-learn(sklearn) 官方文档中文版
sklearn.apachecn.org
License
GPL-3.0 license
0
stars
1.5k
forks
Branches
Tags
Activity
Star
Notifications
Code
Pull requests
0
Actions
Projects
0
Security
Insights
Additional navigation options
Code
Pull requests
Actions
Projects
Security
Insights
Apache-CN/scikit-learn-doc-zh
This commit does not belong to any branch on this repository, and may belong to a fork outside of the repository.
0.19.XBranchesTagsGo to fileCode Folders and filesNameNameLast commit messageLast commit dateLatest commit History762 Commitsdocdoc examplesexamples flowchartflowchart helphelp LICENSELICENSE README.mdREADME.md View all filesRepository files navigationREADMEGPL-3.0 licensescikit-learn(sklearn) 官方文档中文版
scikit-learn 是基于 Python 语言的机器学习工具。
简单高效的数据挖掘和数据分析工具
可供大家在各种环境中重复使用
建立在 NumPy ,SciPy 和 matplotlib 上
开源,可商业使用 - BSD许可证
官网地址: scikit-learn(sklearn): http://scikit-learn.org
中文文档: ApacheCN - scikit-learn(sklearn): http://sklearn.apachecn.org
维护地址
github: https://github.com/apachecn/scikit-learn-doc-zh/
ApacheCN: http://sklearn.apachecn.org/
正在翻译
scikit-learn(sklearn) 0.19
历史版本
scikit-learn(sklearn) 0.18 官方文档中文版: http://cwiki.apachecn.org/pages/viewpage.action?pageId=10030181
参与翻译 & 发现错误
1. 在 github 上 fork 该 repository.
2. 翻译 doc/zh/modules 和 doc/zh/tutorial 下面的 rst 文件即可, 例如, tutorial.rst.
3. 然后, 在你的 github 发起 New pull request 请求.
4. 工具使用, 可参考下面的内容.
工具使用(针对新手)
工欲善其事, 必先利其器 ...
工具随意, 能达到效果就好.
我这里使用的是 VSCode 编辑器.
简易的使用指南请参阅: VSCode Windows 平台入门使用指南, 介绍了 VSCode 与 github 一起搭配的简易使用的方法.
如果要将 VSCode 的 Markdown 预览风格切换为 github 的风格,请参阅: VSCode 修改 markdown 的预览风格为 github 的风格.
注意注意注意:
为了尽量正规化各顶级项目的翻译,更便于以后的迭代更新,我们在 scikit-learn 文档翻译中使用了 Git 的分支,具体应用方法请参阅: 使用 Git 分支进行迭代翻译.
角色分配
目前有如下可分配的角色:
翻译: 负责文章内容的翻译.
校验: 负责文章内容的校验, 比如格式, 正确度之类的.
负责人: 负责整个 Projcet, 不至于让该 Project 成为垃圾项目, 需要在 sklearn 方面经验稍微丰富点.
有兴趣参与的朋友, 可以看看最后的联系方式.
负责人
@chenyyx(Joy yx)
贡献者
贡献者可自行编辑如下内容(排名不分先后).
0.19.0
翻译者(人人皆大佬~):
@wangyangting(那伊抹微笑)
@jiangzhonglian(片刻)
@chenyyx(Joy yx)
@survivingME(Trembleguy)
@mtobeiyf(Fing)
@Leon-Jin(Leon晋)
@X1aoFang(X1aoFang)
@loverollcat(loverollcat)
@helloheshee(helloheshee)
@SkyDreamStart(SkyDreamStart)
@HazekiahWon(Hazekiah Wang)
@201419(tree)
@busesese(wenyi)
@chrzc(changzhicheng)
@Zoctan(Zoctan)
@JanzenLiu(Janzen_Liu)
@charleschou520(charleschou520)
@zhangqiking(BigBird)
@mikechengwei(Mike)
@wodekwan(wodekwan)
@sehriff(sehriff)
@Kdotm(kngines)
@patientman(YuanMingLiu)
@DamonDay(DamonDay)
@cszhangbo(cszhangbo)
@XingxGit(XingxGit)
@KrokYin(KrokYin)
@yw10(Andrew Yao)
@GlassyWu(glassy)
@PrivateRookie(PrivateRookie)
@linweijiang(linweijiang)
@jiaqiangbandongg(jiaqiangbandongg)
@supportingvector(supportingvector)
@stealthsMrs(stealthsMrs)
@lhwlhw90(lhwlhw90)
@sheepmen(羊三)
@guohao916(guohao_dm)
@Daemon-ser(csu_hgq)
@wangxiancai(BWM-蜜蜂)
@夜神月(夜神月)
@liyangbit(Lemon)
@XuJianzhi(XuJianzhi)
校验者(人人皆大佬~)(现在还不齐全,贡献者大佬们可随意修改)
@FontTian(FontTian)
@XuJianzhi(XuJianzhi)
@caopeirui(Veyron C)
@HelloSilicat(Jialiang Pei)
@AnybodyHome(loop)
@pan8664716(pan8664716)
@xrj(xrj)
@qvduoduo1997(qvduoduo1997)
@marsjhao(Zhang Junhao)
@tiantian1412(tiantian1412)
@sheepmen(羊三)
@wangyangting(那伊抹微笑)
@jiangzhonglian(片刻)
@chenyyx(Joy yx)
@mikechengwei(Mike)
@wangxiancai(BWM-蜜蜂)
@busesese(wenyi)
@GlassyWu(glassy)
@wodekwan(wodekwan)
@gbyy422990(Bin GAO)
@charleschou520(charleschou520)
@DataMonk2017(Jeremy Zheng)
@Lixu518(Mysry)
@linxiamen(YUNCHUAN LIN)
@llcing(Mayouji)
@KyrieHee(HeYun)
@ziepenn(ziepenn)
@FAN0521(FAN0521)
@Daemon-ser(csu_hgq)
@shaoyy147(Y.Shao)
@Kdotm(kngines)
@chrzc(changzhicheng)
@ywujudy(ywujudy)
@污剑客(污剑客)
@爱吹牛逼的小明(爱吹牛逼的小明)
@JanzenLiu(Janzen_Liu)
@Ecauchy(Ecauchy)
0.18
请参阅: http://cwiki.apachecn.org/pages/viewpage.action?pageId=10030181
联系方式
有任何建议反馈, 或想参与文档翻译, 麻烦联系下面的企鹅:
企鹅: 1042658081(那伊抹微笑), 190442212(小瑶), 529815144(片刻)
其它中文文档
TensorFlow R1.2 中文文档
sklearn 0.18 中文文档
Spark 2.2.0 中文文档
Spark 2.0.2 中文文档
Kudu 1.4.0 中文文档
Zeppelin 0.7.2 中文文档
Elasticsearch 5.4 中文文档
Kibana 5.2 中文文档
Storm 1.1.0 中文文档
About
scikit-learn(sklearn) 官方文档中文版
sklearn.apachecn.org
Resources
Readme
License
GPL-3.0 license
Activity
Custom properties
Stars
0
stars
Watchers
2
watching
Forks
0
forks
Report repository
Releases
No releases published
Packages
0
No packages published
Languages
Python
100.0%
Footer
© 2024 GitHub, Inc.
Footer navigation
Terms
Privacy
Security
Status
Docs
Contact
Manage cookies
Do not share my personal information
You can’t perform that action at this time.