scikit-learn 简称 sklearn,是 Python 最经典的机器学习库。如果你刚开始学 AI,或者需要快速做一个预测模型,sklearn 是第一个应该学的库。它提供了几乎所有传统机器学习算法:回归、分类、聚类、降维、特征选择、模型评估。
和深度学习框架不同,sklearn 的数据量级适合万到百万级,适合大多数业务场景的数据分析。API 设计非常一致——所有模型都有 fit、predict、score 三个方法。sklearn 和 pandas、numpy 配合使用是做数据分析和建模的黄金组合。
免费开源。和 PyTorch 比,sklearn 不能做深度学习。和 XGBoost 比,sklearn 的 GBM 实现不如 XGBoost 快。适合做传统机器学习任务的数据科学家。
