51CTO充电了么Spark分布式机器学习 – 序列模式挖掘prefixSpan算法【陈敬雷】

网盘目录

01 序列模式挖掘算法原理与介绍.mp463.7 mb
02 序列模式挖掘算法应用场景.mp48.63 mb
03 序列模式挖掘算法的基本概念.mp445.51 mb
04 PrefixSpan算法的基本概念.mp48.15 mb
05 PrefixSpan算法流程.mp417.64 mb
06 PrefixSpan算法优势和劣势.mp411.68 mb
07 SparkMLlib实现的PrefixSpan算法源码实战.mp489.86 mb
08 自研轻量级序列模式挖掘源码实战.mp410.17 mb
免费试看
充电了么

适合人群:

适合技术开发人员、大学生、职业晋升等; 机器学习、数据挖掘、人工智能开发者; 转行人工智能、机器学习者

你将会学到:

培养大数据开发、数据分析挖掘、推荐算法、自然语言处理、机器学习、深度学习工程师

课程简介:

一、课程优势



本课程有陈敬雷老师的清华大学出版社配套新书教材《分布式机器学习实战》人工智能科学与技术丛书,



新书配合此实战课程结合学习,一静一动,互补高效学习!



本课程由互联网一线知名大牛陈敬雷老师全程亲自授课,技术前沿热门,是真正的互联网工业级实战项目。



二、课程简介



     序列模式挖掘最早的提出是为了找出用户几次购买行为之间的关系。我们也可以理解成找出那些经常出现的序列组合构成的模式。它与关联规则的挖掘是不一样的,序列模式挖掘的对象以及结果都是有序的,即数据集中的项在时间和空间上是有序排列的,这个有序的排列正好可以理解成大多数人的行为序列(例如:购买行为),输出的结果也是有序的,而关联规则的挖掘是不一样的。



      关联规则的挖掘容易让我们想到那个”尿布与啤酒”的故事,它主要是为了挖掘出两个事物间的联系,首先这两个事物之间是没有时间可空间的联系的,可以理解成它们之间是无序的。例如:泡面——火腿  在我们的生活中大多数人在买泡面后会选择买火腿,但是每个人购买的顺序是不一样的,就是说这两个在时空上是没有联系的,找到的是搭配规律。这就是关联规则挖掘。



       序列模式挖掘的挖掘出来的是有序的。我们考虑一个用户多次在超市购物的情况,那么这些不同时间点的交易记录就构成了一个购买序列,例如:1用户在第一次购买了商品A,第二次购买了商品B和C;那么我们就生成了一个1用户的购物序列A-B,C.当N个用户的购买序列就形成了一个规模为N的数据集。这样我们就可以找到像”尿不湿–婴儿车”这样的存在因果关系的规律。因此序列模式挖掘相对于关联规则挖掘可以挖掘出更加深刻的知识。

    

     序列模式挖掘和和关联规则算法是比较类似的,但项集是有序的,相对关联规则的推荐算法更精准。



     本课就从序列模式挖掘简介、序列模式挖掘应用场景、 序列模式挖掘基本概念、PrefixSpan的基本概念、PrefixSpan算法流程、PrefixSpan算法优势和劣势、Spark MLlib实现的PrefixSpan源码实战、充电了么自研序列模式挖掘源码实战等从理论到实践进行详细的讲解,解开序列模式挖掘算法神秘的面纱。难得的一线实战经验!三、老师介绍



陈敬雷  充电了么创始人,CEO兼CTO



陈敬雷,北京充电了么科技有限公司创始人,CEO兼CTO
,十几年互联网从业经验,曾就职于用友、中软、凡客、乐蜂网(唯品会)、猎聘网、人民日报(灵思云途)、北京万朝科技,曾任架构师、首席技术官、首席科学家等职务,对业务领域B端、C端、电商、职场社交招聘、内容文娱、营销行业都有着丰富的经验,在技术领域,尤其在大数据和人工智能方向有丰富的算法工程落地实战经验,其中在猎聘网任职期间主导的推荐算法系统项目获得公司优秀项目奖,推荐效果得到5倍的提升。



陈敬雷著有清华大学出版社两本人工智能书籍,分别是《分布式机器学习实战(人工智能科学与技术丛书)》、《自然语言处理原理与实战(人工智能科学与技术丛书)》。



目前专注于大数据和人工智能驱动的上班族在线教育行业,研发了充电了么app和网站,用深度学习算法、nlp、推荐引擎等技术来高效提升在线学习效率。



四、《分布式机器学习实战》新书介绍及最新热点技术解密如下:

陈敬雷老师的京东自营书名标题: 分布式机器学习实战(人工智能科学与技术丛书)



  


 

****************好评如潮**************

本书作者陈敬雷曾在多家一线大型互联网公司任职,也有过技术创业的背景,经历过从0到1,从1从100的技术发展历程,尤其在AI、大数据、机器学习、深度学习等方面有很强的理论基础和实战经验。《分布式机器学习实战》包含了目前主流互联网公司所采用的大数据、AI方面的系统架构、中间件、工具、机器学习/深度学习算法等,内容由浅入深,全面详实,强烈推荐给读者!

                                                                                                                        ——陈兴茂 (猎聘CTO)



我读了这本书,有三点深切的体会,一、系统全面:本书把分布式机器学习的关键环节进行了系统化梳理,介绍了主流的技术和工具平台,同时对大数据技术也做了详细讲解,对内容的梳理全面丰富,是入门、参考、提高的有益工具书!二、深入浅出:通过大量的系统化讲课,配合丰富的素材、案例和实际操作场景介绍,可以说是不但授人以渔也同时授人以鱼!开卷有益!现学现用!活学活用!三、讲解清晰,思路明确:可以看出作者是有深厚的功底,是经过长期实践的经验总结,又融合了大量的最新结果,连同职业路径规划都详细做好,有此一书,是难得佳作!



        ——梅一多 博士(上海市青年拔尖人才获得者,阿里云最有价值技术专家,中基凌云科技有限公司联合创始人兼CTO)



《分布式机器学习实战》这本书非常贴近实战,含盖了目前各类应用场景的算法系统,对每个场景都有理论基础、源代码、算法解度等,深入浅出的讲解对于读者具有很强的实用性,做为大数据及人工智能领域的从业人员是必选的工具类参考书。



       ——杨正洪 博士(中央财经大学财税大数据实验室首席科学家)



此书的作者非常贴近实战,不“高来高去”讲一些宏观的概念,书中的每一个算法,每一个场景都是来自于当前的商业应用,对于读者来讲这是一本难得的实用宝典。



       ——刘冬冬(知名市场战略、生态系统和企业数字化转型专家,首席数据官联盟创始人,曾先后服务过统一集团、联想集团、百度、美国D&B集团、华为技术、海航科技集团等)



陈敬雷写的这本书理论联系实践,深入浅出,覆盖技术面广,并且有工业级的系统案例,包含目前比较热门的推荐算法系统、人脸识别、对话机器人等项目,对常见的大数据算法系统架构也做了详细讲解,是一本机器学习方面的佳作。本书不管是初学者、架构师、还是资深人士,都会开卷有益、有所收获。



                        ——龙旭东(北京掌游智慧科技有限公司董事长,曾任海航科技集团CTO和文思海辉董事,北京大学计算机系学士+硕士)


全网最全最新最专业的资源站
九章资源站 » 51CTO充电了么Spark分布式机器学习 – 序列模式挖掘prefixSpan算法【陈敬雷】

发表回复

全网最全最新最专业的资源站

购买会员 联系客服