XGBoost 是一个实现梯度提升决策树(GBDT)的算法库,在结构化数据的预测问题上表现极其出色。Kaggle 竞赛中超过一半的冠军方案用了 XGBoost——它在表格数据上的预测准确率通常比神经网络还要好。
XGBoost 的核心优势在于处理表格数据——电商的销量预测、金融的风险评分、广告的点击率预估。它支持特征重要性分析、缺失值自动处理、正则化防止过拟合。训练速度快,分布式版本可以处理上亿行数据。
免费开源。和 scikit-learn 的 GradientBoosting 比,XGBoost 快 10 倍以上。适合做结构化数据预测的数据科学家和分析师。
访问官网