hadoop權(quán)威指南第4版下載 最新更新|軟件分類|軟件專題|手機(jī)版|論壇轉(zhuǎn)貼|軟件發(fā)布

您當(dāng)前所在位置: 首頁教程下載程序開發(fā) → hadoop權(quán)威指南第四版中文版電子書 pdf版本

hadoop權(quán)威指南第四版中文版電子書

pdf版本

hadoop權(quán)威指南第四版中文版電子書下載
  • 軟件大小:8.56 MB
  • 軟件語言:中文
  • 軟件類型:國產(chǎn)軟件 / 程序開發(fā)
  • 軟件授權(quán): 免費(fèi)軟件
  • 更新時(shí)間:2017-10-30 15:49:30
  • 軟件等級:4星
  • 軟件廠商: -
  • 應(yīng)用平臺(tái):WinXP, Win7, Win8, Win10
  • 軟件官網(wǎng):

ITMOP本地下載文件大?。?.56 MB

點(diǎn)贊 好評 0%(0) 差評 差評 0%(0)

軟件介紹人氣軟件精品推薦相關(guān)文章網(wǎng)友評論下載地址

小編為您推薦: hadoop權(quán)威指南 hadoop 電子圖書

hadoop權(quán)威指南第4版是一款針對于Hadoop發(fā)展現(xiàn)狀和應(yīng)用進(jìn)行詳細(xì)的分析講解,由淺入深全方位介紹了Hadoop,并通過海量數(shù)據(jù)分析儲(chǔ)存,更加清晰了解集群安裝運(yùn)維,高性能的分析平臺(tái)和海量數(shù)據(jù)處理。歡迎來IT貓撲下載使用。

hadoop權(quán)威指南第四版中文版pdf介紹

Hadoop是一個(gè)由Apache基金會(huì)所開發(fā)的分布式系統(tǒng)基礎(chǔ)架構(gòu)。

用戶可以在不了解分布式底層細(xì)節(jié)的情況下,開發(fā)分布式程序。充分利用集群的威力進(jìn)行高速運(yùn)算和存儲(chǔ)。

Hadoop實(shí)現(xiàn)了一個(gè)分布式文件系統(tǒng)(Hadoop Distributed File System),簡稱HDFS。HDFS有高容錯(cuò)性的特點(diǎn),并且設(shè)計(jì)用來部署在低廉的(low-cost)硬件上;而且它提供高吞吐量(high throughput)來訪問應(yīng)用程序的數(shù)據(jù),適合那些有著超大數(shù)據(jù)集(large data set)的應(yīng)用程序。HDFS放寬了(relax)POSIX的要求,可以以流的形式訪問(streaming access)文件系統(tǒng)中的數(shù)據(jù)。

hadoop權(quán)威指南第4版

hadoop權(quán)威指南第四版作者簡介

Tom White,數(shù)學(xué)王子&Hadoop專家。身為Apache Hadoop提交者八年之久,Apache軟件基金會(huì)成員之一。全球知名云計(jì)算公司Cloudera的軟件工程師。Tom擁有英國劍橋大學(xué)數(shù)學(xué)學(xué)士學(xué)位和利茲大學(xué)科學(xué)哲學(xué)碩士學(xué)位。

hadoop權(quán)威指南第四版電子書第三章免費(fèi)部分閱讀

第3章 Hadoop分布式文件系統(tǒng)

當(dāng)數(shù)據(jù)集的大小超過一臺(tái)獨(dú)立的物理計(jì)算機(jī)的存儲(chǔ)能力時(shí),就有必要對它進(jìn)行分區(qū)(partition)并存儲(chǔ)到若干臺(tái)單獨(dú)的計(jì)算機(jī)上。管理網(wǎng)絡(luò)中跨多臺(tái)計(jì)算機(jī)存儲(chǔ)的文件系統(tǒng)稱為分布式文件系統(tǒng)(distributed filesystem)。該系統(tǒng)架構(gòu)于網(wǎng)絡(luò)之上,勢必會(huì)引入網(wǎng)絡(luò)編程的復(fù)雜性,因此分布式文件系統(tǒng)比普通磁盤文件系統(tǒng)更為復(fù)雜。例如,使文件系統(tǒng)能夠容忍節(jié)點(diǎn)故障且不丟失任何數(shù)據(jù),就是一個(gè)極大的挑戰(zhàn)。

Hadoop自帶一個(gè)稱為HDFS的分布式文件系統(tǒng),即HadoopDistributed Filesystem。在非正式文檔或舊文檔以及配置文件中,有時(shí)也簡稱為DFS,它們是一回事兒。HDFS是Hadoop的旗艦級文件系統(tǒng),也是本章的重點(diǎn),但實(shí)際上Hadoop是一個(gè)綜合性的文件系統(tǒng)抽象,因此接下來我們將了解將Hadoop與其他存儲(chǔ)系統(tǒng)集成的途徑,例如本地文件系統(tǒng)和Amazon S3系統(tǒng)。

3.1 HDFS的設(shè)計(jì)

HDFS以流式數(shù)據(jù)訪問模式來存儲(chǔ)超大文件,運(yùn)行于商用硬件集群上。①讓我們仔細(xì)看看下面的描述。

* 超大文件 “超大文件”在這里指具有幾百M(fèi)B、幾百GB甚至幾百TB大小的文件。目前已經(jīng)有存儲(chǔ)PB級數(shù)據(jù)的Hadoop 集群了。②

* 流式數(shù)據(jù)訪問 HDFS的構(gòu)建思路是這樣的:一次寫入、多次讀取是最高效的訪問模式。數(shù)據(jù)集通常由數(shù)據(jù)源生成或從數(shù)據(jù)源復(fù)制而來,接著長時(shí)間在此數(shù)據(jù)集上進(jìn)行各種分析。每次分析都將涉及該數(shù)據(jù)集的大部分?jǐn)?shù)據(jù)甚至全部,因此讀取整個(gè)數(shù)據(jù)集的時(shí)間延遲比讀取第一條記錄的時(shí)間延遲更重要。

* 商用硬件 Hadoop并不需要運(yùn)行在昂貴且高可靠的硬件上。它是設(shè)計(jì)運(yùn)行在商用硬件(在各種零售店都能買到的普通硬件③)的集群上的,因此至少對于龐大的集群來說,節(jié)點(diǎn)故障的幾率還是非常高的。HDFS遇到上述故障時(shí),被設(shè)計(jì)成能夠繼續(xù)運(yùn)行且不讓用戶察覺到明顯的中斷。

同樣,那些不適合在HDFS上運(yùn)行的應(yīng)用也值得研究。目前HDFS對某些應(yīng)用領(lǐng)域并不適合,不過以后可能會(huì)有所改進(jìn)。

IT貓撲小編推薦

準(zhǔn)備好釋放數(shù)據(jù)的強(qiáng)大潛能了嗎?借助于這本本書,你將學(xué)習(xí)如何使用ApacheHadoop構(gòu)建和維護(hù)穩(wěn)定性高、伸縮性強(qiáng)的分布式系統(tǒng)。本書是為程序員寫的,可幫助他們分析任何大小的數(shù)據(jù)集。本書同時(shí)也是為管理員寫的,幫助他們了解如何設(shè)置和運(yùn)行Hadoop集群。

hadoop權(quán)威指南第四版中文版pdf未出,暫提供英文原版閱讀。

更多>> 軟件截圖

推薦應(yīng)用

    其他版本下載

      精品推薦

      相關(guān)文章

      下載地址

      • hadoop權(quán)威指南第四版中文版電子書 pdf版本

      查看所有評論>> 網(wǎng)友評論

      發(fā)表評論

      (您的評論需要經(jīng)過審核才能顯示) 網(wǎng)友粉絲QQ群號(hào):374962675

      查看所有 0條 評論>>

      更多>> 猜你喜歡