Tag: 机器学习
Wide&Deep模型与DCN模型
本文介绍了Wide & Deep模型和DCN(Deep & Cross Network)模型的原理、实现及其在处理特征学习中的应用。文章详细描述了Wide部分的简单线性变换和Deep部分的多层感知机结构,并解释了如何通过Cross Network改进Wide部分以显式建模特征之间的交叉。...
ID3、C4.5和Cart树
·约 7055 字·15 分钟
This is a blog post on the implementation of DecisionTree algorithm using C++....
分类问题常用CE而不是MSE
·约 1432 字·4 分钟
本文分析了机器学习中分类任务常用MSE而非CE的原因,并从分布角度、优化角度进行了详细讨论。文章指出,MSE假设数据服从高斯分布,而现实中长尾分布也很常见,直接使用MSE可能导致效果不佳。同时,文中还提到在优化的角度上,如果分类问题使用MSE作为损失函数,是非凸优化,难以求出最优解。...
XGBoost原理必知必会
·约 4170 字·9 分钟
本文详细推导了XGBoost的原理,包括损失函数的定义、目标函数的优化以及正则化方法。文章还介绍了XGBoost的训练方法和常见的疑难点,如训练速度慢、并行化问题、高维特征处理和过拟合缓解等。...