大数据与云计算应该怎么学?

如题所述

学习大数据必须掌握的技术

Hadoop

高效、可靠、可伸缩的Hadoop——能够为你的数据存储项目提供所需的YARN、HDFS和基础架构,并且运行主要的大数据服务和应用程序。hadoop擅长日志分析,facebook就用Hive来进行日志分析。

Hive

Hive是建立在Hadoop上的数据仓库基础构架。hive的工作模式是:提交一个任务,等到任务结束时被通知,而不是实时查询。相对应的是,类似于Oracle这样的系统当运行于小数据集的时候,响应非常快。它提供了一系列的工具,可以用来进行数据提取转化加载(ETL)——这是一种可以存储、查询和分析存储在Hadoop中的大规模数据的机制。

难易程度分析:

Spark

Spark使用简单,而且可以支持所有重要的大数据语言,如Scala、Python、Java、R等。同时,它还拥有强大的生态系统,且成长迅速,对microbatching/batching/SQL的支持也很简单。最重要的是,Spark能更好地适用于数据挖掘与机器学习等需要迭代的MapReduce的算法。

Python

Python的特点是面向对象的解释性的脚本语言,支持多态、继承等高级概念,在Python里使用OOP十分容易 没有C++、Java那样复杂。Python的使用是完全免费的,同时对用户的提问提出快速的支持。

温馨提示:答案为网友推荐,仅供参考
第1个回答  2021-03-10

第三集-大数据与云计算。科技视野

第2个回答  2019-08-12
这两个专业这边都有,可以来看看参观体验
相似回答