51CTO充电了么Hadoop大数据平台之Hive数据仓库及数据分析操作实战【陈敬雷】

网盘目录

01 Hive原理介绍.mp433.57 mb
02 Hive表结构定义语法.mp48.77 mb
03 Hadoop集群平台HDFS热门常用命令.mp421.31 mb
04 Hive SQL语句精讲.mp462.14 mb
05 用Shell脚本如何执行Hive Sql.mp423.56 mb
06 Azkaban调度、Oozie调度执行封装hive的shel.mp49.3 mb
07 Hive数据仓库模型设计.mp421.78 mb
08 Hive UDF函数.mp426.42 mb
09 Hive数据仓库Linux生产服务器实战操作.mp4338.21 mb
免费试看
充电了么

适合人群:

适合零基础、大学生、职业晋升等; 大数据、数据分析、数据挖掘开发者; 转行大数据、Python数据分析者。

你将会学到:

培养大数据开发、数据分析挖掘、推荐算法、自然语言处理、机器学习、深度学习工程师

课程简介:

一、课程优势



本课程有陈敬雷老师的清华大学出版社配套新书教材《分布式机器学习实战》人工智能科学与技术丛书,



新书配合此实战课程结合学习,一静一动,互补高效学习!



本课程由互联网一线知名大牛陈敬雷老师全程亲自授课,技术前沿热门,是真正的互联网工业级实战项目。



二、课程简介



        Hive作为大数据平台Hadoop之上的主流应用,公司一般都是用它作为公司的数据仓库,分布式机器学习的训练数据和数据处理也经常用它来处理。

      Hive是建立在 Hadoop 上的数据仓库基础构架。它提供了一系列的工具,可以用来进行数据提取转化加载(ETL),这是一种可以存储、查询和分析存储在 Hadoop 中的大规模数据的机制。Hive是基于Hadoop的一个数据仓库工具,可以将结构化的数据文件映射为一张数据库表,并提供简单的SQL查询功能, Hive 定义了简单的类 SQL 查询语言,称为 HQL,它允许熟悉 SQL 的用户查询数据。

     Hive可以将SQL语句转换为MapReduce任务进行运行。 其优点是学习成本低,可以通过类SQL语句快速实现简单的MapReduce统计,不必开发专门的MapReduce应用,十分适合数据仓库的统计分析。同时,这个Hive也允许熟悉 MapReduce 开发者的开发自定义的 mapper 和 reducer 来处理内建的 mapper 和reducer无法完成的复杂的分析工作。比如UDF函数。



      下面我们就从以下几个方向给大家做深度的讲解,同时在服务器上操作实战演示,对就是:理论+实战!



1、Hive介绍



2、Hive表结构定义



3、Hadoop HDFS热门常用命令



4、Hive SQL语句



5、用shell脚本如何执行hive sql



6、Azkaban调度、Oozie调度执行封装hive的shell脚本,及crontab调度



7、Hive数据仓库设计



8、Hive UDF函数



9、Hive数据仓库Linux生产服务器实战操作


三、老师介绍



陈敬雷  充电了么创始人,CEO兼CTO



陈敬雷,北京充电了么科技有限公司创始人,CEO兼CTO
,十几年互联网从业经验,曾就职于用友、中软、凡客、乐蜂网(唯品会)、猎聘网、人民日报(灵思云途)、北京万朝科技,曾任架构师、首席技术官、首席科学家等职务,对业务领域B端、C端、电商、职场社交招聘、内容文娱、营销行业都有着丰富的经验,在技术领域,尤其在大数据和人工智能方向有丰富的算法工程落地实战经验,其中在猎聘网任职期间主导的推荐算法系统项目获得公司优秀项目奖,推荐效果得到5倍的提升。



陈敬雷著有清华大学出版社两本人工智能书籍,分别是《分布式机器学习实战(人工智能科学与技术丛书)》、《自然语言处理原理与实战(人工智能科学与技术丛书)》。



目前专注于大数据和人工智能驱动的上班族在线教育行业,研发了充电了么app和网站,用深度学习算法、nlp、推荐引擎等技术来高效提升在线学习效率。



四、《分布式机器学习实战》新书介绍及最新热点技术解密如下:

陈敬雷老师的京东自营书名标题: 分布式机器学习实战(人工智能科学与技术丛书)



  


 

****************好评如潮**************

本书作者陈敬雷曾在多家一线大型互联网公司任职,也有过技术创业的背景,经历过从0到1,从1从100的技术发展历程,尤其在AI、大数据、机器学习、深度学习等方面有很强的理论基础和实战经验。《分布式机器学习实战》包含了目前主流互联网公司所采用的大数据、AI方面的系统架构、中间件、工具、机器学习/深度学习算法等,内容由浅入深,全面详实,强烈推荐给读者!

                                                                                                                        ——陈兴茂 (猎聘CTO)



我读了这本书,有三点深切的体会,一、系统全面:本书把分布式机器学习的关键环节进行了系统化梳理,介绍了主流的技术和工具平台,同时对大数据技术也做了详细讲解,对内容的梳理全面丰富,是入门、参考、提高的有益工具书!二、深入浅出:通过大量的系统化讲课,配合丰富的素材、案例和实际操作场景介绍,可以说是不但授人以渔也同时授人以鱼!开卷有益!现学现用!活学活用!三、讲解清晰,思路明确:可以看出作者是有深厚的功底,是经过长期实践的经验总结,又融合了大量的最新结果,连同职业路径规划都详细做好,有此一书,是难得佳作!



        ——梅一多 博士(上海市青年拔尖人才获得者,阿里云最有价值技术专家,中基凌云科技有限公司联合创始人兼CTO)



《分布式机器学习实战》这本书非常贴近实战,含盖了目前各类应用场景的算法系统,对每个场景都有理论基础、源代码、算法解度等,深入浅出的讲解对于读者具有很强的实用性,做为大数据及人工智能领域的从业人员是必选的工具类参考书。



       ——杨正洪 博士(中央财经大学财税大数据实验室首席科学家)



此书的作者非常贴近实战,不“高来高去”讲一些宏观的概念,书中的每一个算法,每一个场景都是来自于当前的商业应用,对于读者来讲这是一本难得的实用宝典。



       ——刘冬冬(知名市场战略、生态系统和企业数字化转型专家,首席数据官联盟创始人,曾先后服务过统一集团、联想集团、百度、美国D&B集团、华为技术、海航科技集团等)



陈敬雷写的这本书理论联系实践,深入浅出,覆盖技术面广,并且有工业级的系统案例,包含目前比较热门的推荐算法系统、人脸识别、对话机器人等项目,对常见的大数据算法系统架构也做了详细讲解,是一本机器学习方面的佳作。本书不管是初学者、架构师、还是资深人士,都会开卷有益、有所收获。



                        ——龙旭东(北京掌游智慧科技有限公司董事长,曾任海航科技集团CTO和文思海辉董事,北京大学计算机系学士+硕士)


全网最全最新最专业的资源站
九章资源站 » 51CTO充电了么Hadoop大数据平台之Hive数据仓库及数据分析操作实战【陈敬雷】

发表回复

全网最全最新最专业的资源站

购买会员 联系客服