資源名稱:Hadoop視頻教程套餐下載-零基礎大數據實戰培訓教程配文本項目案例教程內容:Avro數據序列化系統(1)Avro數據序列化系統(2)Chukwa集群監控系統(1)Chukwa集群監控系統(2)Flume日志收集系統(1)Flume日志收集系統(2)Greenplum架構(1)Greenplum架構(2)Greenplum架構(3)Greenplum架構(4)Hadoop2.0YARN深...
資源名稱:大數據真實案列分析《HadoopSpark企業應用實戰》11月份班教程內容:授 課 對 象商業智能(BI)和企業數據倉庫(EDW)的管理人員、建模人員、分析和開發人員、系統管理員等;有意將Hadoop生態系統中的組件,作為現有EDW的補充,或未來替代產品的項目負責人及開發人員;企業中牽涉到大數據處理的數據中心運行、規劃、設計負責人;Hadoop企業級應用、整合項目的成員、負責人、開發人員...
資源名稱:煉數成金Hadoop視頻教程內容:1.Hadoop的源起與體系介紹2.Hadoop的源起與體系介紹3.Hadoop的源起與體系介紹4.實施Hadoop集群5.實施Hadoop集群6.實施Hadoop集群7.分布式文件系統HDFS,大數據存儲實戰8.分布式文件系統HDFS,大數據存儲實戰9.分布式文件系統HDFS,大數據存儲實戰10.Map-Reduce體系架構11.Map-Reduce體...
資源名稱:Hadoop2.x基礎課程教程內容:00_課程大綱介紹01_Hadoop2.x簡介及核心項目簡介02_Hadoop2.x生態圈簡介03_Hadoop 2.x 源碼編譯(Linux 64位操作系統)04_Hadoop 2.x 目錄結構說明05_導入源碼至Eclipse06_HDFS 框架架構一覽介紹07_YARN 框架架構一覽介紹08_Hadoop 2.x 偽分布式環境安裝09_HDFS ...
資源名稱:Python+Spark 2.0+Hadoop機器學習與大數據實戰內容簡介:本書從淺顯易懂的“大數據和機器學習”原理說明入手,講述大數據和機器學習的基本概念,如分類、分析、訓練、建模、預測、機器學習(推薦引擎)、機器學習(二元分類)、機器學習(多元分類)、機器學習(回歸分析)和數據可視化應用等。書中不僅加入了新近的大數據技術,還豐富了“機器學習”內容。 為降低讀者學習大數據技術的門檻,書...
資源名稱:Hadoop集群與安全內容簡介:Hadoop自動化安裝和配置的問題在于隱藏了許多Hadoop組件協同工作的重要細節,本書介紹如何手動安裝和配置主要的Hadoop組件,以便高效使用Hadoop平臺。通過設置一個完全可運行的集群,可對Hadoop內部的運行機制產生更深入的了解,并且有助于你調試任何可能發生的問題。本書還介紹了保障基于Hadoop的大數據平臺安全的實現方案和最佳實踐,覆蓋Ker...
資源名稱:Hadoop YARN權威指南內容簡介:《Hadoop YARN權威指南》由YARN的創建和開發團隊親筆撰寫,Altiscale的CEO作序鼎力推薦,是使用Hadoop YARN建立分布式、大數據應用的權威指南。書中利用多個實例,詳細介紹Hadoop YARN的安裝和管理,以幫助用戶使用YARN進行應用開發,并在YARN上運行除了MapReduce之外的新框架。《Hadoop YARN權...
資源名稱:大數據處理系統:Hadoop源代碼情景分析內容簡介:Hadoop是目前重要的一種開源的大數據處理平臺,讀懂Hadoop的源代碼,深入理解其各種機理,對于掌握大數據處理的技術有著顯而易見的重要性。 本書從大數據處理的原理開始,講到Hadoop的由來,進而講述對于代碼的研究方法,然后以Hadoop作為樣本,較為詳盡地逐一分析大數據處理平臺各核心組成部分的代碼,并從宏觀上講述這些部分的聯系和作...
資源名稱:R與Hadoop大數據分析實戰內容簡介:本書全面而系統地講解了如何將R語言與Hadoop技術結合并應用于大數據分析,不僅系統且深入地闡釋了R與Hadoop集成技術的工具、方法、原則和最佳實踐,而且通過大量實踐案例深入剖析各種常見問題,能為用戶高效利用R語言與Hadoop技術進行大數據處理提供翔實指導。全書分為四部分,共7章:第一部分(第1~2章)是基礎知識,主要講解R語言以及Hadoop...
資源名稱:Hadoop構建數據倉庫實踐作者簡介:王雪迎,畢業于中國地質大學計算機專業,高級工程師,擁有20年數據庫、數據倉庫相關技術經驗。曾先后供職于北京現代商業信息技術有限公司、北京在線九州信息技術服務有限公司、華北計算技術研究所、北京優貝在線網絡科技有限公司,擔任DBA、數據架構師等職位。資源目錄:第1章 數據倉庫簡介1.1 什么是數據倉庫 11.1.1 數據倉庫的定義 11.1.2 建立數據...
資源名稱:Hadoop技術內幕_深入解析HADOOP_COMMON和HDFS架構設計與實現原理內容簡介:《Hadoop技術內幕:深入解析Hadoop Common和HDFS架構設計與實現原理》內容簡介:“Hadoop技術內幕”共兩冊,分別從源代碼的角度對“Common+HDFS”和MapReduce的架構設計與實現原理進行了極為詳細的分析。《Hadoop技術內幕:深入解析Hadoop Common...
資源名稱:Hadoop硬實戰 內容簡介:Hadoop 是一個開源的MapReduce 平臺,設計運行在大型分布式集群環境中,為開發者進行數據存儲、管理以及分析提供便利的方法。《Hadoop硬實戰》詳細講解了Hadoop 和MapReduce 的基本概念,并收集了85 個問題及其解決方案。在關鍵問題領域對基礎概念和實戰方法做了權衡。《Hadoop硬實戰》適合使用Hadoop 進行數據存儲、管理和分析...
資源名稱:Hadoop MapReduce實戰手冊 內容簡介:這是一本學習Hadoop MapReduce的一站式指南,完整介紹了Hadoop生態體系,包括Hadoop平臺安裝、部署、運維等,Hadoop生態系統成員Hive、Pig、HBase、Mahout等。最重要的是,書中包含豐富的示例和多樣的實際應用場景,以一種簡單而直接的方式呈現了90個實戰攻略,并給出一步步的指導。本書從獲取Hadoop...
資源名稱:Hadoop 2.X HDFS源碼剖析內容簡介:《Hadoop 2.X HDFS源碼剖析》以Hadoop 2.6.0源碼為基礎,深入剖析了HDFS 2.X中各個模塊的實現細節,包括RPC框架實現、Namenode實現、Datanode實現以及HDFS客戶端實現等。《Hadoop 2.X HDFS源碼剖析》一共有5章,其中第1章從總體上介紹了HDFS的組件、概念以及典型的流程,同時詳細介紹...
資源名稱:高可用性的HDFS——Hadoop分布式文件系統深度實踐內容簡介:《高可用性的hdfs—hadoop分布式文件系統深度實踐》專注于hadoop分布式文件系統(hdfs)的主流ha解決方案,內容包括:hdfs元數據解析、hadoop元數據備份方案、hadoopbackup node方案、avatarnode解決方案以及最新的ha解決方案cloudrea ha namenode等。其中有關b...
資源名稱:深入理解Hadoop.第2版 內容簡介:本書作者基于對Hadoop系統的實踐,深入淺出地對Hadoop進行了詳細的講解,包含大量的實例和技巧,可幫助有一定基礎的開發者快速掌握分布式系統。主要內容包括:第1章~第4章講解大數據系統的基本概念、Hadoop系統的關鍵概念,以及進行Hadoop平臺管理的關鍵概念要素。第5章~第7章是本書的重點,深入分析了MapReduce框架,不僅包括MapR...
資源名稱:Hadoop云計算技術手冊 內容簡介: Hadoop是一個開源的分布式并行計算平臺,它主要由MapReduce的算法執行和一個分布式的文件系統等兩部分組成。Hadoop起源于Doug Cutting大牛領導開發的Nutch搜索引擎項目的子項目。現在是Apache軟件基金會管理的開源項目。 本文主要介紹Hadoop及相關技術,從Hadoop的起源開始講述,主要涵蓋了...
資源名稱:Hadoop開發者入門專刊內容簡介: 《Hadoop開發者入門專刊》教程主要內容:Hadoop源代碼eclipse編譯教程、在Windows上安裝Hadoop教程、在Windows上使用Cygwin安裝HBase、Hive應用介紹、Hive執行計劃解析等內容。對Hadoop開發入門有較好的指導作用。 Hadoop是一個由Apache基金會所開發的分布式系統基礎...
資源名稱:Hadoop_RPC詳細分析內容簡介:本書主要對Hadoop RPC進行詳細分析;有需要的朋友可以下載看看。HadoopRPC邏輯上分成三部分:1.1. RPC InterfaceRPC對外接口。1.2. RPC ServerRPC服務端的實現。1.3. RPC ClientRPC客戶端的實現。資源截圖: