htk好人呢,出题挺简单的,甚至kmeans都不忍让大家算两轮
简答题
- C4.5相比ID3的改进
- 简单介绍下EM算法
- 介绍下词项-文档矩阵,实现这个矩阵的步骤
- 介绍下NLP常见任务和特征应用
- 什么是聚类,给出2种常见的聚类方法
- 训练集、验证集和测试集的作用和区别
- 写出泊松分布的概率密度函数,参数的意义
- 写出正态分布的概率密度函数
计算题
- 写出正态分布的似然函数,用极大似然估计推出
- 给6个数据点,用Kmeans计算一轮,算出两个簇的中心点
- 朴素贝叶斯的模板题
- 用n-gram算一个句子的概率(n = 2)
- 给两个句子,用词袋给出词向量