机器学习老司机都会回答的32道面试常见问题

1 为什么对机器学习来说,有一套健壮的度量标准是很重要的?常见的评价标准有那些了?

2 为什么特征提取和工程学在机器学习中如此重要?常见的特征提取方法有哪些?

3 什么是训练集、验证集、测试集和在监督和无监督学习中的分别指什么?

4 什么是偏差(bias)和方差 (variance)之间的权衡?能不能举一个例子?能不要用图表示?

5 什么是过拟合?怎么画图来表示过拟合?

6 什么是交叉验证?交叉验证要注意什么?

7 什么是向量,向量的范数又是怎样用在机器学习中的?

8 Numpy Pands Scipy 常用的数据类型有哪些?

9 如何通过matplotlib来可视化数据

10 TF -IDF技术说的是什么?有哪些应用?

11 分箱binning 如何在连续的数据中应用?

12 什么是数据正则化?有什么好处?怎么实现?

13 卡方检测是什么?在什么时候使用?

14 什么是互信息?互信息在特征选择中有什么用?

15 什么是损失函数, 在机器学习中,对参数进行正则化参数处理是什么意思?

16 什么是线性模型?举出线性模型的优点?并举出一些线性模型来?

17 什么是OR 值,这代表了什么?

18 Sigmoid函数和logistic函数是什么?代表什么意义?

19 梯度下降算法的原理是什么?随机梯度下降与原版的区别是什么?

20什么是线性最小二乘法回归?

21 Lasso回归,岭回归 和弹性网,这三种惩罚模型复杂度的方案有和不同,各有什么利弊?

22 逻辑回归算法是什么?

23 什么是多元逐步回归算法?

24 如何在线性模型中应对非线性数据?

25 什么是朴素贝叶斯模型?如何在连续数据中使用朴素贝叶斯模型?

26 什么是伯努力分布?这和多参数朴素贝叶斯模型有什么关系?

27 什么是标准缩放(Standard Scaling)?有什么用处?

28 为什么了解数据在各个统计量上的分布对训练机器学习模型很重要?

29 如何用K个最近邻居的模型(KNN)进行分类?

30 支持向量机是什么?其中的核技巧(kenerl trick)指的是什么?

31 什么是K means聚类法?怎么实现?

32 如何使用Spark进行文本主题分类?

在公众号后台 回复:“答案”,即可查看上述问题的答案。

欢迎关注巡洋舰的深度学习实战课程, 手把手带你进行深度学习实战, 课程涵盖机器学习,深度学习, 深度视觉, 深度自然语言处理, 以及极具特色的深度强化学习,看你能不能学完在你的领域跨学科的应用深度学习惊艳你的小伙伴,成为身边人眼中的大牛, 感兴趣的小伙伴可以点击阅读原文。

阅读原文

好坏2017-11-06 07:35:11

答案

SEAN2017-11-06 07:23:20

答案

兰钰2017-11-06 07:11:07

答案

作者

在公众号上回复啊