Rpengの博客
Rpengの博客
文章
标签
项目
小工具
关于
文章
标签
项目
小工具
关于
搜索
Tag: 机器学习
Wide&Deep模型与DCN模型
8/20/2024
·
约 4248 字
·
9 分钟
机器学习
搜广推
本文介绍了Wide & Deep模型和DCN(Deep & Cross Network)模型的原理、实现及其在处理特征学习中的应用。文章详细描述了Wide部分的简单线性变换和Deep部分的多层感知机结构,并解释了如何通过Cross Network改进Wide部分以显式建模特征之间的交叉。...
ID3、C4.5和Cart树
8/20/2024
·
约 7055 字
·
15 分钟
机器学习
This is a blog post on the implementation of DecisionTree algorithm using C++....
FM模型
8/20/2024
·
约 1122 字
·
3 分钟
机器学习
搜广推
本文介绍了FM模型,这是一种统计学模型,用于处理高维稀疏数据和特征交叉,能捕捉特征之间的关系。FM模型通过引入低秩因子向量来减少计算参数的数量,并增加对特征交互作用的捕捉,特别关注二阶相互作用。该模型采用梯度下降法优化损失函数,并通过因子向量学习用户与物品之间的相互作用。在推荐系统中,FM模型可用于预测用户对物品的评分或点击概率,通过分析用户与商品的特征相互作用来进行预测。...
协同过滤模型
1/17/2025
·
约 1528 字
·
4 分钟
机器学习
本文深入探讨了协同过滤算法,包括User CF和Item CF两种基本方法及其优缺点。同时,文章还详细讨论了矩阵分解技术在推荐系统中的应用,包括特征值分解、奇异值分解(SVD)和梯度下降法的基本原理、优点与缺点。此外,文章指出了当前协同过滤模型面临的挑战以及潜在的改进方向。...
分类问题常用CE而不是MSE
10/1/2024
·
约 1432 字
·
4 分钟
机器学习
本文分析了机器学习中分类任务常用MSE而非CE的原因,并从分布角度、优化角度进行了详细讨论。文章指出,MSE假设数据服从高斯分布,而现实中长尾分布也很常见,直接使用MSE可能导致效果不佳。同时,文中还提到在优化的角度上,如果分类问题使用MSE作为损失函数,是非凸优化,难以求出最优解。...
XGBoost原理必知必会
7/25/2024
·
约 4170 字
·
9 分钟
机器学习
本文详细推导了XGBoost的原理,包括损失函数的定义、目标函数的优化以及正则化方法。文章还介绍了XGBoost的训练方法和常见的疑难点,如训练速度慢、并行化问题、高维特征处理和过拟合缓解等。...