OfferRealize机器学习面试辅导课(面试真题+项目+系统设计) – 2023 完整版 超清画质

课程大纲
第1讲 Google 如何考回归模型
课程内容:欢迎来到机器学习世界!这一节我们将介绍如何利用数据教会机器学习。如何将真实世界的问题建模为正确类别的机器学习问题。还包括机器学习的基本术语,例如假设空间、归纳偏好等。然后,我们介绍回归问题, 它是一类用于预测连续变量的监督学习模型。真实世界中,股价的预测,温度湿度的预测等都是回归问题。本节将介绍一系列经典的回归模型,包括linear regression, 岭回归,Lasso 回归,GBDT regression 等。
如何建模Youtube的CTR提升问题,search engine 的拼写填充问题?
岭回归和lasso 回归的本质是什么?各有什么优劣势?
GBDT是怎么解决回归问题的?为什么是在boosting gradient ?
R square 和 adjusted R square有什么区别?
第2讲 FLAG如何考分类问题
课程内容:分类问题是一类用于预测类别标签的机器学习问题。真实世界中,Amazon的推荐系统、Google的搜索引擎、排序等领域包含着大量地分类问题。本节讲介绍一系列经典的分类模型,包括logistics regression,SVM,决策树,随机森林,KNN等
什么是support vectors?
如何通过样本量大小来选择分类器?
Naïve Bayes的两种优化方法,MAP和MLE的区别?
Linear SVM和Non-linear SVM的区别是什么?
Kernel function是什么?什么时候使用kernel function?
Log loss 和hinge loss的区别?
KNN是监督学习方法还是无监督学习方法
Naïve Bayes的参数是什么?为什么是Naïve的?
第3讲 大厂DS如何训练机器学习模型
课程内容:大厂DS在使用机器学习模型的时候,常常会遇到很多问题,例如模型不收敛,模型效果很差等。本节主要讨论如何训练机器学习模型,如何避免模型失效等。
当input为categorical data, output 为 real-value可以使用是什么相关性分析方法?
梯度是什么?如何计算?
什么情况会导致梯度爆炸和消失?
怎么诊断bias和variance?
梯度下降和OLS的区别是什么?
第4讲 如何用树模型解决异常检测
树模型很长一段时间是各大厂的star算法,它们鲁棒性强,在有噪声的数据上依然拔得头筹。本节主要学习几个经典树模型算法,decision tree, GBDT, XGBoost等。这节课我们安排树模型的实践项目。
什么是information Gain?
什么是Gini index?
GBDT的工作原理, 为什么GBDT是在boosting gradient?
XGBoost 和GBDT的区别,各自的优势?
什么是集成学习,它有什么好处?
第5讲 FLAG如何用无监督方法解决维度灾难问题?
课程内容:无监督学习常用于减少样本复杂度,观察样本分布特点。通过聚类我们可以发现数据的结果信息,从而做出更好的决策。本节主要学习几个经典树聚类算法,K-means, 层次聚类,密度聚类等和经典的dimension reduction的方法。
有哪些常见度量方法
什么是curse-of-dimension,请举一个例子?
层次聚类和密度聚类分别是什么,有什么区别?
K-means和K-means ++ 的区别
K-means的收敛性存在吗?
如何用PCA对数据降维
第6讲 一节课掌握Google最强强化学习算法
强化学习被誉为通往人工智能的终极算法。目前各大公司都想争先落地强化学习,强化学习是Google的王牌算法,这也是ML最难的方法。目前强化学习方向DS还较为稀缺。本节主要讨论强化学习经典算法,Q-learning, policy gradient等
常考的知识点
什么是on-policy 什么是off-policy
什么样的问题可以被定义为强化学习?
Q-learning和policy gradient的区别?
Reward 和value的区别?
为什么推荐可以看成是强化学习的问题?
第7讲 如何应对百变machine learning 系统设计和 A/B Test,以Two-Sigma的时间序列预测为例
机器学习系统设计是任何机器学习面试的重要组成部分。解决问题、确定需求和讨论权衡的能力可以帮助面试者在数百名其他候选人中脱颖而出。本课程将帮助同学了解模型技术的实践状态以及在大规模生产中应用 ML 模型的最佳实践。以Two-sigma如何做时间序列预测为例,展开ML系统构建。
时间序列数据怎么做预处理
缺失值如何处理
稳态分布是什么?
如何clarify the requirements?
如何设计A/B test?
How long to tun a A/B test?
How to do inference in A/B test?
如何分析A/B test的结果
如何deploy一个ML 系统到真实平台上?
如何让数据预处理scalable, reliable and fast?
第8讲 Microsoft和Google 如何考察深度学习基础
课程内容:各大公司目前基本重要业务都由深度学习支撑起来。深度学习几乎霸榜各大类机器学习问题,这节课我们会学习深度学习的基本概念,例如激活函数、反向传播、batch normalization, Dropout等。
什么是激活函数?
Relu, sigmoid等激活函数的区别?
Drop out 原理是什么
Batch normalization的好处?
如何避免梯度消失?
第9讲 大厂如何利用深度学习初阶模型
课程内容:在了解了深度学习基本概念后,这节课我们会学习深度学习的常见模型,例如MLP, RNN, LSTM,CNN,GAN,VAE等
什么是卷积核,为什么要用卷积核?
LSTM和RNN的区别
Pooling layer VS. convolutional layer
GRU和LSTM的区别是什么
为什么RNN会出现gradient vanish 的问题
LSTM的工作原理
第10讲 Google的深度学习大模型们
课程内容:在完成初阶学习后,我们进入目前最新且最受欢迎的深度学习模型,他们被大量应用在推荐,搜索,自然语言处理等领域。本节主要讨论深度学习高阶算法,Attention, Transformer,Bert,以及预训练模型等。
常考知识点:
什么是attention?
Attention的工作原理是什么?
Transformer工作原理是什么?
ResNet有效的原因的什么?
第11讲 Amazon,Netflix, Hulu,Google,Alibaba的三大经典推荐系统算法
课程内容:搜广推是各大厂的核心业务。本节主要讨论推荐系统是什么,以及工业界常用的推荐模型,例如DeepFM, GNN, DIN等。
常考的知识点:
DeepFM的深浅学习分别是什么
推荐系统常用的评价指标是什么
GNN的hop数目多大越好吗?
工业界推荐系统结构是什么?
怎么解决推荐中sparsity的问题
第12讲 Google三大自然语言处理实战算法
课程内容:在自然语言处理(NLP)领域中,翻译是一项重要的任务。翻译任务涉及将一种自然语言(源语言)的文本转换为另一种自然语言(目标语言)的等效文本
翻译任务面临许多挑战,因为语言之间存在语法、词汇、语义和文化差异等方面的复杂性。翻译系统需要能够理解源语言文本的含义,并能够准确地表达出目标语言的等效含义。。本节讲介绍常见的翻译模型,n-gram, encoder-decoder RNN等。
Bi-LSTM和LSTM的区别
翻译任务的目标函数是什么
哪些任务是seq2seq的任务

全网最全最新最专业的资源站
九章资源站 » OfferRealize机器学习面试辅导课(面试真题+项目+系统设计) – 2023 完整版 超清画质

发表回复

全网最全最新最专业的资源站

购买会员 联系客服