
文章插圖
學(xué)習(xí)大數(shù)據(jù)并不是一蹴而就的事情,即使是工作多年的開發(fā)工程師都需要不斷補(bǔ)充新鮮的知識(shí)內(nèi)容 。目前學(xué)習(xí)大數(shù)據(jù)知識(shí)可以通過視頻和圖書兩種方式學(xué)習(xí),視頻的優(yōu)勢(shì)在于能夠?qū)⒗蠋煹膫€(gè)人開發(fā)經(jīng)驗(yàn)傳授給學(xué)習(xí)者,而圖書的優(yōu)勢(shì)在于能夠隨時(shí)翻閱,內(nèi)容比較豐富 。
這里為大家推薦零基礎(chǔ)學(xué)習(xí)大數(shù)據(jù)的10本經(jīng)典圖書,希望同學(xué)們能夠通過不同的學(xué)習(xí)途徑充分掌握大數(shù)據(jù)開發(fā)技能 。
大數(shù)據(jù)學(xué)習(xí)10本經(jīng)典圖書推薦
1、《大數(shù)據(jù)時(shí)代》
《大數(shù)據(jù)時(shí)代》是國(guó)外大數(shù)據(jù)系統(tǒng)研究的先河之作,本書作者維克托·邁爾·舍恩伯格被譽(yù)為“大數(shù)據(jù)商業(yè)應(yīng)用一人”,擁有在哈佛大學(xué)、牛津大學(xué)、耶魯大學(xué)和新加坡國(guó)立大學(xué)等多個(gè)互聯(lián)網(wǎng)研究重鎮(zhèn)任教的經(jīng)歷,早在2010年就在《經(jīng)濟(jì)學(xué)人》上發(fā)布了長(zhǎng)達(dá)14頁(yè)對(duì)大數(shù)據(jù)應(yīng)用的前瞻性研究 ?!洞髷?shù)據(jù)時(shí)代》認(rèn)為大數(shù)據(jù)的核心就是預(yù)測(cè) 。大數(shù)據(jù)將為人類的生活創(chuàng)造前所未有的可量化的維度 。書中展示了谷歌、微軟、IBM、蘋果、facebook、twitter、VISA等大數(shù)據(jù)先鋒們具價(jià)值的應(yīng)用案例 。作者圍繞“要全體不要抽樣、要效率不要絕對(duì)精確、要相關(guān)不要因果”三大理念,通過數(shù)十個(gè)商業(yè)和學(xué)術(shù)案例,剖析了萬(wàn)事萬(wàn)物數(shù)據(jù)化和數(shù)據(jù)復(fù)用挖掘的巨大價(jià)值 。
2、《一本書讀懂大數(shù)據(jù)》
進(jìn)入大數(shù)據(jù)時(shí)代,讓數(shù)據(jù)開口說話將成為司空見慣的事情,本書將從大數(shù)據(jù)時(shí)代的前因后果講起,全面分析大數(shù)據(jù)時(shí)代的特征、企業(yè)實(shí)踐的案例、大數(shù)據(jù)的發(fā)展方向、未來的機(jī)遇和挑戰(zhàn)等內(nèi)容,展現(xiàn)一個(gè)客觀立體、自由開放的大數(shù)據(jù)時(shí)代 。
3、《Hadoop權(quán)威指南》
Hadoop是大數(shù)據(jù)技術(shù)中的核心內(nèi)容之一 。本書內(nèi)容豐富,展示了如何使用Hadoop構(gòu)建可靠、可伸縮的分布式系統(tǒng),程序員可從中探索如何分析海量數(shù)據(jù)集,管理員可以了解如何建立與運(yùn)行Hadoop集群 。
4、《Hive編程指南》
Hive是基于Hadoop的一個(gè)數(shù)據(jù)倉(cāng)庫(kù)工具 。一本ApacheHive的編程指南,旨在介紹如何使用Hive的SQL方法,通過大量的實(shí)例,首先介紹如何在用戶環(huán)境下安裝和配置Hive,并對(duì)Hadoop和MapReduce進(jìn)行詳盡闡述,演示Hive如何在Hadoop生態(tài)系統(tǒng)進(jìn)行工作 。
5、《HBase權(quán)威指南》
HBase是一個(gè)分布式的面向列的開源數(shù)據(jù)庫(kù) 。如何通過使用與HBase高度集成的Hadoop將HBase的可伸縮性變得簡(jiǎn)單;把大型數(shù)據(jù)集分布到相對(duì)廉價(jià)的商業(yè)服務(wù)器集群中;了解HBase架構(gòu)的細(xì)節(jié),包括存儲(chǔ)格式、預(yù)寫日志、后臺(tái)進(jìn)程等;在HBase中集成MapReduce框架;了解如何調(diào)節(jié)集群、設(shè)計(jì)模式、拷貝表、導(dǎo)入批量數(shù)據(jù)和刪除節(jié)點(diǎn)等 。
6、《Flink入門與實(shí)戰(zhàn)》
Flink是一款開源處流處理框架,其河西是Java和Scala編程的分布式流數(shù)據(jù)流引擎 。這是一本Flink入門級(jí)圖書,力求詳細(xì)而完整地描述Flink基礎(chǔ)理論與實(shí)際操作,旨在幫助讀者從零開始快速掌握Flink的基本原理與核心功能 。
7、《Kafka入門與實(shí)踐》
Kafka是一種高吞吐量的分布式發(fā)布訂閱消息系統(tǒng),它可以處理消費(fèi)者在網(wǎng)站中的所有動(dòng)作流數(shù)據(jù) 。本書是基于Kafka 0.10.1.1版本,深入剖析Kafka源碼與框架 。書中的大量實(shí)例來源于作者在實(shí)際工作中的實(shí)踐,具有現(xiàn)實(shí)指導(dǎo)意義 。
8、《Spark快速大數(shù)據(jù)分析》
這是一本為Spark 初學(xué)者準(zhǔn)備的書,它沒有過多深入實(shí)現(xiàn)細(xì)節(jié),而是更多關(guān)注上層用戶的具體用法 。不過,本書絕不僅僅限于Spark 的用法,它對(duì)Spark 的核心概念和基本原理也有較為全面的介紹,讓讀者能夠知其然且知其所以然 。
9、《大數(shù)據(jù)技術(shù)全解:基礎(chǔ)、設(shè)計(jì)、開發(fā)與實(shí)踐》
以上關(guān)于本文的內(nèi)容,僅作參考!溫馨提示:如遇健康、疾病相關(guān)的問題,請(qǐng)您及時(shí)就醫(yī)或請(qǐng)專業(yè)人士給予相關(guān)指導(dǎo)!
「愛刨根生活網(wǎng)」www.malaban59.cn小編還為您精選了以下內(nèi)容,希望對(duì)您有所幫助:- 教你提高u盤的讀寫速度 u盤寫入速度慢怎么辦
- 現(xiàn)在最流行語(yǔ)言是那些?
- 10最經(jīng)典男女對(duì)唱情歌推薦 男女合唱好聽的歌
- 飛蛾撲火,乳燕投鍋 飛蛾撲火的下一句
- 現(xiàn)實(shí)生活中真的癌癥村 癌癥村名單
- 金來沅的妻子是誰(shuí) 金來沅的妻子
- 翡翠加工的詳細(xì)步驟,翡翠制作成飾品講究有多復(fù)雜?
- 俏色巧雕!冰種紅翡雕刻的一鳴驚人,真是美極了!
- 難得的紅翡,精彩的雕刻
- 翡翠的手工雕刻流程是啥,掌握翡翠手工雕刻的巧奪天工
