Tag: 机器学习
Wide&Deep模型与DCN模型
本文介绍了Wide & Deep模型和DCN(Deep & Cross Network)模型的原理、实现及其在处理特征学习中的应用。文章详细描述了Wide部分的简单线性变换和Deep部分的多层感知机结构,并解释了如何通过Cross Network改进Wide部分以显式建模特征之间的交叉。...
ID3、C4.5和Cart树
·约 7493 字·16 分钟
This is a blog post on the implementation of DecisionTree algorithm using C++....
分类问题常用CE而不是MSE
·约 1567 字·4 分钟
本文分析了机器学习中分类任务常用MSE而非CE的原因,并从分布角度、优化角度进行了详细讨论。文章指出,MSE假设数据服从高斯分布,而现实中长尾分布也很常见,直接使用MSE可能导致效果不佳。同时,文中还提到在优化的角度上,如果分类问题使用MSE作为损失函数,是非凸优化,难以求出最优解。...
XGBoost原理必知必会
·约 4289 字·9 分钟
本文详细推导了XGBoost的原理,包括损失函数的定义、目标函数的优化以及正则化方法。文章还介绍了XGBoost的训练方法和常见的疑难点,如训练速度慢、并行化问题、高维特征处理和过拟合缓解等。...
LightGBM和XGBoost
·约 1270 字·3 分钟
AI摘要: AI摘要: 本文介绍了LightGBM的基本原理、工程实现亮点以及相对于XGBoost的改进。LightGBM是微软开发的一种梯度提升决策树(GBDT)模型,具有训练速度快和内存占用少的特点。文章详细阐述了直方图近似法、GOSS单边梯度采样、EFB互斥特征捆绑等技术细节,并比较了与XGBoost的不同之处。...