大神,关于大数据处理方面的书籍有推荐吗?

如题所述

《大数据处理之道》作者:何金池
分析比较了当下流行的大数据处理技术的优劣及适用场景,包括Hadoop、Spark、Storm、Dremel、Drill等,详细分析了各种技术的应用场景和优缺点;同时阐述了大数据下的日志分析系统,重点讲解了ELK日志处理方案;最后分析了大数据处理技术的发展趋势,重点从各种技术的起源、设计思想、架构等方面阐述大数据处理之道。
温馨提示:答案为网友推荐,仅供参考
第1个回答  2021-01-06

在人人高呼的大数据时代,你是想继续做一个月薪6K+的码农,还是想要翻身学习成为炙手可热名企疯抢的大数据工程师呢?

随着互联网技术的发展,大数据行业前景非常被看好,有很多朋友对大数据行业心向往之,却苦于不知道该如何下手,或者说学习大数据不知道应该看些什么书。作为一个零基础大数据入门学习者该看哪些书?今天就给大家分享几本那些不容错过的大数据书籍。

1、《数据挖掘》

这是一本关于数据挖掘领域的综合概述,本书前版曾被KDnuggets的读者评选为最受欢迎的数据挖掘专著,是一本可读性极佳的教材。它从数据库角度全面系统地介绍数据挖掘的概念、方法和技术以及技术研究进展,并重点关注近年来该领域重要和最新的课题——数据仓库和数据立方体技术,流数据挖掘,社会化网络挖掘,空间、多媒体和其他复杂数据挖掘。

2、《Big Data》

这是一本在大数据的背景下,描述关于数据建模,数据层,数据处理需求分析以及数据架构和存储实现问题的书。这本书提供了令人耳目一新的全面解决方案。但不可忽略的是,它也引入了大多数开发者并不熟悉的、困扰传统架构的复杂性问题。本书将教你充分利用集群硬件优势的Lambda架构,以及专门用来捕获和分析网络规模数据的新工具,来创建这些系统。

3、《Mining of Massive Datasets》

这是一本书是关于数据挖掘的。但是本书主要关注极大规模数据的挖掘,也就是说这些数据大到无法在内存中存放。由于重点强调数据的规模,所以本书的例子大都来自Web本身或者Web上导出的数据。另外,本书从算法的角度来看待数据挖掘,即数据挖掘是将算法应用于数据,而不是使用数据来“训练”某种类型的机器学习引擎。

对大数据分析有兴趣的小伙伴们,不妨先从看看大数据分析书籍开始入门!B站上有很多的大数据教学视频,从基础到高级的都有,还挺不错的,知识点讲的清晰,还有完整版的学习路线图。也可以自己去看看,下载学习试试。

第2个回答  2019-07-17
学习大数据的小伙伴在小编看来总共分为两大类:一是本身就是计算机专业出身,有一定的编程基础,看到大数据的就业前景,想转战大数据行业的;二是本身不是计算机专业出身,没有一定的编程基础,依旧想要学习大数据的。

1、没有编程基础
对于没有编程基础的小伙伴,建议你先看一些编程语言的书籍,掌握一门编程语言是必须的,因为大数据技术是由编程语言进行开发的,至少是要掌握一门编程语言的,而且还要有扎实的基础。
《Head First Java, 2nd Edition(中文版)》
这本书不仅内容丰富、有趣且通俗易懂,并且涵盖了所有 Java 相关的基础知识。如果你是 Java 初学者,这本书正适合你。
《Java 核心技术(卷1、2)》
写作风格相比 Head First 趣味性来说更显传统,所涵盖的内容包括 Java 基础知识及高级应用,是对于入门来说的另一种选择。
《Java 编程思想(第4版)》
必读之作,不仅涵盖所有 Java 基础,对于编程思想层面的提升也有很好的帮助。
2、有一定的编程基础
《为数据而生》
书中分别阐述在大数据1.0、大数据2.0和大数据3.0时代下,相对应的数据分析需要做到分析、外化、集成。
《智能时代》
这本书作者分七章从不同角度对大数据进行介绍,分别以技术和思维方式的改变为主线,从工业革命这个角度嵌入,顺理成章的延伸出大数据与智能化,但是没有将过多笔墨放在技术的深究上,而是选择从应用层面体现大数据的理念。大数据应用则会渗透到各行各业,这正是作者的用心之处。
《R语言预测实战》
R语言横跨了金融、生物、医学、互联网等多个领域,主要用于统计、建模及可视化。由于上手快、效率高,备受技术人员青睐。预测是大数据挖掘的主要作用之一,借助R语言来做大数据预测,可以兼具效率与价值于一身。
《数据之巅》
这本书中,从小数据时代到大数据的崛起,作者以宏大的历史观、文化观、大数据观,给我们描绘了一幅数据科学、智慧文化的全景图。
《Hadoop权威指南》
《Hadoop权威指南(中文版)》从Hadoop的缘起开始,由浅入深,结合理论和实践,全方位地介绍Hadoop这一高性能处理海量数据集的理想工具。
《Hive编程指南》
《Hive编程指南》是一本Apache Hive的编程指南,旨在介绍如何使用Hive的SQL方法HiveQL来汇总、查询和分析存储在Hadoop分布式文件系统上的大数据集合。
以上就是大数据学习书籍推荐,想要学习大数据的小伙伴可以酌情参考了!
相似回答