Skip to main content
 Web开发网 » 编程语言 » Python语言

想自学大数据,不知道从哪里学起,有什么书籍和学习路线推荐么?

2021年11月27日370百度已收录

谢邀!笔者刚签约大数据挖掘工程师岗位,也是在研究生阶段才转为大数据方向。大数据目前正火热,很多同学想要转入,但学习路线对于自学的人来讲因人而异。

拿自身举例,笔者之前是Python数据分析出生,编程能力一般,因此在这个基础上先学习linux基本操作命令,安装ubuntu双系统并进一步安装Hadoop和Spark组件,在此基础上利用Pyspark操作Spark大数据框架进行学习。可以推荐如下书籍:

《Pyspark实战指南》

想自学大数据,不知道从哪里学起,有什么书籍和学习路线推荐么?  Python分布式计算 第1张

而要完全进入大数据领域还不够,因为大数据框架比较侧重开发,所以需要有scala语言功底(scala语言是Spark的原生语言),而scala语言跟JAVA关联性很强且完全兼容,所以如果有一定JAVA基础的话完全可以从scala入手,推荐的书籍如下:

《Spark编程基础(scala版)》

想自学大数据,不知道从哪里学起,有什么书籍和学习路线推荐么?  Python分布式计算 第2张

视频教程强烈推荐林子雨老师在MOOC慕课上的国家精品免费课程,由浅入深,非常容易上手。

想自学大数据,不知道从哪里学起,有什么书籍和学习路线推荐么?  Python分布式计算 第3张

评论列表暂无评论
发表评论
微信