深·观察深·观察

数据挖掘如何就业？

2016年11月08日 18:42 | 来源：芝诺数据分析mp

分享到：

5. hadoop,hive之类的需要学习吗？

我觉得应当学习，首先Hadoop和Hive很简单（如果你用AWS的话你可以开一台EMR，上面直接就有Hadoop和Hive，可以直接从使用学起）。

我觉得如果不折腾安装和部署，还有Linux和MySQL的经验，只要半天到一天就能熟悉Hadoop和Hive的使用（当然你得有Linux和MySQL的基础，如果没有就先老老实实的学Linux和MySQL，这两个都可以在自己的PC上安装，自己折腾）。

Spark对很多人来说才是需要学习的，如果你有JAVA经验大可以从JAVA入门。如果没有那么还是建议从Scala入门，但是实际上如果没有JAVA经验，Scala入门也会有一定难度，但是可以慢慢补。

所以总的来说Spark才足够难，以至于需要学习。

最后的最后我有一些建议。第一要对自己有一个系统的认知，自己的编程水平够么，SQL会用么，Linux会用么，能流畅的看英文文档么？

如果上面任何一个问题的答案是No，我都不建议直接转行或者申请高级的数据挖掘职位（因为你很难找到一个正经的数据挖掘岗位，顶多是一些打擦边球的岗位，无论是实际干的工作还是未来的成长可能对你的帮助都不大）。

无论你现在是学生还是已经再做一些前段后端、运维之类的工作你都有足够的时间补齐这些基础知识。

补齐了这些知识之后，第一件事就是了解大数据生态，Hadoop生态圈，Spark生态圈，机器学习，深度学习（后两者需要高等数学和线性代数基础，如果你的大学专业学这些不要混）。

选定其中一个方向做一些钻研和学习，网上有很多现成的资料（基本上是英文的，所以我说了，不能看英文的赶紧去背单词），科学上网用谷歌这个大家都懂。希望我的建议能对你有一些帮助。

编辑：梁霄

01 02 03

关键词：数据挖掘学习公司算法机器生态圈