Learning HBase中文版 Learning HBase 中文版

謝帕夫(Shriparv,S.)

  • 出版商: 電子工業
  • 出版日期: 2015-10-01
  • 定價: $390
  • 售價: 8.5$332
  • 語言: 簡體中文
  • 頁數: 249
  • 裝訂: 平裝
  • ISBN: 7121270722
  • ISBN-13: 9787121270727
  • 相關分類: NoSQL
  • 下單後立即進貨 (約4週~6週)

買這商品的人也買了...

商品描述

譯者從事相關工作多年,具有豐富的理論知識和實踐經驗,一直工作在技術最前沿,對相關知識有很深刻的理解。

作者簡介

Shashwat Shriparv生於印度比哈爾邦穆紮法爾布爾縣。他先後在穆紮法爾布爾和梅加拉亞邦西隆求學。他在德里英迪拉•甘地國立開放大學獲得計算機應用學士(BCA)學位,在喀拉拉邦科欽科技大學(特里凡得瑯C-DAC)獲得計算機應用碩士(MCA)學位。他在2010年早些時候開始研究大數據技術,當時他需要做一個用大數據技術存儲和處理日誌的概念驗證(POC)。同時他還有另一個項目,在此項目中需要存儲巨大的不同文件頭的二進製文件並要處理它們。這時,他開始配置、搭建並測試Hadoop HBase集群,並為它們寫了一些代碼。在做了一個成功的POC之後,他用Java REST和SOAP Web服務做了些開發,並搭立了一個系統,在此系統中通過Web服務利用Hadoop存儲和處理日誌,然後在HBase中通過自定義表存儲這些日誌,通過HBase API和HBase-Hive映射查詢來讀取數據。Shashwat成功地實現了這個項目,緊接著開始了1TB到3TB的大規模二進製文件頭的處理工作,他把文件的元數據存儲在HBase中,文件本身存在HDFS上。


Shashwat在特里凡得瑯C-DAC網絡取證中心開始他的軟件開發生涯,為取證分析開發可移動相關軟件。接著,他去了Genilok Computer Solutions公司,在那裡,他的工作包括:集群計算、HPC技術和Web技術。
在此之後,他從特里凡得瑯到了班加羅爾並加入了PointCross,在那裡他開始了大數據技術工作,用Java開發軟件、Web服務和大數據平台。在PointCross,他的很多項目都是圍繞著大數據技術,例如Hadoop、HBase、Hive、Pig、 Sqoop、 Flume等。從這裡他又到了HCL Infosystems公司,開始做UIDAI項目,這是一個在印度非常有聲望的項目,它為每一個印度居民提供一個唯一身份識別號。在這裡,他工作中使用的技術有:HBase、Hive、 Hadoop、 Pig、 Linux、腳本語言、管理HBase Hadoop集群、編寫腳本、自動化任務和處理、為集群監控創建儀錶盤。


現在,Shashwat在Cognilytics公司工作,專注於大數據技術、 HANA以及其他高性能技術。你可以通過了解更多關於他的信息
Shashwat曾經審校過Pig Design Pattern, Pradeep Pasupuleti, Packt Publishing一書,他還曾擔任過他大學雜誌InfinityTech的編輯。

目錄大綱

第1章了解HBase生態系統1 
基於Hadoop的HBase架構2 
RDBMS和HBase的架構對比3 
HBase的特徵3 
HBase在Hadoop生態系統中的位置4 
HBase中的數據表示5 
Hadoop 6 
HBase與關係型數據庫的功能對比8 
行存儲數據庫的邏輯展現9 
列存儲數據庫的邏輯展現9 
HBase的內部存儲架構11 
開始使用HBase11 
HBase是何時出現的11 
HBase的組件和功能14 
ZooKeeper 14 
誰在用HBase?為什麼要用?19 
什麼時候考慮使用HBase?20 
什麼時候不使用HBase?21 
了解一些開源的HBase工具21 
Hadoop和HBase版本兼容性對照表22 
HBase的應用23 
HBase的優點和缺點24 
小結25 

第2章開啟HBase之旅26 
深入理解HBase的組件27 
HFile 27 
Region 27 
可擴展性——理解縱向擴展和橫向擴展的過程29
讀寫週期32 
Write—Ahead Logs 33 
MemStore 33 
HBase內部管理34 
合併34 
Region分裂35 
Region分配36 
Region合併37 
RegionServer故障轉移37 
HBase的刪除請求37 
讀寫週期37 
可用的HBase發行版本列表38 
HBase的必備條件和容量規劃39 
DNS正向解析39 
DNS反向解析40 
SSH 41 
小結45 

第3章搭建HBase46 
在Ubuntu上下載Java 46 
主機配置52 
基於主機文件52 
基於命令52 
基於文件52 
基於DNS 54 
安裝和配置SSH 54 
在Ubuntu/Red Hat/CentOS上安裝SSH 55 
配置SSH 55 
安裝和配置NTP 56 
容量規劃57 
安裝和配置Hadoop 58 
core—site.xml 63 
hdfs—site.xml 63
yarn—site.xml 65 
mapred—site.xml 66 
hadoop—env.sh 67 
yarn—env.sh 67 
Hadoop的啟動步驟67 
配置Apache HBase69 
在單機模式中配置HBase69 
在分佈式模式中配置HBase70 
安裝和配置ZooKeeper 74 
安裝Cloudera版本的Hadoop和HBase76 
下載RPM包76 
簡易安裝Cloudera 77 
安裝Hadoop和MapReduce包77 
在Windows上安裝Hadoop 78 
小結81 

第4章優化HBase/Hadoop集群82 
Hadoop/HBase集群的類型82 
CDH集群的推薦配置84 
容量規劃85 
優化Hadoop 86 
通用優化技巧86 
優化Java GC 86 
優化Linux操作系統87 
優化Hadoop參數87 
優化MapReduce 88 
優化HBase91 
Hadoop 91 
內存93 
Java 93
操作系統94 
HBase94 
優化ZooKeeper 96 
Hadoop中的重要配置文件96 
HBase中的重要配置文件97 
小結98 

第5章HBase的存儲、框架以及數據類型99 
HBase的數據類型100 
HBase中的數據存儲——邏輯視圖vs .真實物理視圖101 
命名空間102 
HBase服務103 
行鍵(Row key)104 
列族(Column family)104 
列(Column)104 
單元格(Cell)104 
版本(Version)104 
時間戳(Timestamp)105 
數據模型的操作105 
讀(Get)105 
寫(Put)106 
掃描(Scan)106 
刪除(Delete)106 
版本和原因107 
決定版本數量108 
版本的下界108 
版本的上界108 
模式設計109 
表類型的設計113 
短寬和高瘦設計模式的好處114 
複合鍵設計115 
在HBase中計算存儲的數據大小118 
小結119

第6章HBase集群運維與故障處理120 
Hadoop shell命令121 
Hadoop shell命令的類型121 
HBaseshell命令140 
HBase管理工具149 
hbck——HBase檢查149 
HBase健康檢查腳本151 
寫HBaseshell腳本151 
使用Hadoop工具或者JAR 151 
用Hive連接HBase153 
HBaseregion管理155 
壓縮155 
合併155 
HBase節點管理155 
服役155 
退役156 
實現安全性157 
安全訪問157 
Kerberos KDC 157 
客戶端的安全配置158 
服務器端的安全配置159 
簡單的安全160 
客戶端配置161 
標籤的安全特性162 
HBase的訪問控制163 
使用標籤的單元格訪問168 
配置ZooKeeper安全169 
HBase常見錯誤的故障排查和相關說明170 
集群失敗的可能情況171 
監控HBase的健康狀況172
小結175 

第7章HBase腳本編程176 
HBase中的備份與恢復技術176 
離線備份/full—shutdown備份177 
在線備份178 
Windows上的HBase185 
在HBase中進行腳本編程185 
.irbrc文件187 
獲取時間戳188 
開啟調試189 
在HBase中開啟SQL 189 
參與HBase190 
小結190 

第8章HBaseJava編程191 
準備開發環境192 
構建Java客戶端程序192 
數據類型196 
數據模型的Java操作196 
讀操作196 
寫操作204 
修改操作206 
HBase過濾器208 
過濾器類型209 
客戶端API 214 
小結215 

第9章HBaseJava高級編程216 
接口、類和異常216 
管理任務編程218 
數據操作代碼224 
MapReduce和HBase226 
RESTful和Thrift服務接口231
RESTful服務接口231 
Thrift服務接口232 
HDFS編程233 
高級主題簡介237 
協處理器237 
布隆過濾器238 
Lily項目238 
小結239 

第10章HBase使用案例240 
HBase在當今行業中的作用240 
HBase和關係型數據庫的未來的對比241 
一些現實世界中的工程使用案例241 
HBase在Facebook 241 
HBase在Pinterest 243 
HBase在Groupon 244 
HBase在LongTail Video 246 
HBase在Aadhaar(UIDAI)247 
有用的鏈接和參考248 
小結249