大數據演算法 大数据算法 (大数据技术丛书)

王宏志

下單後立即進貨 (約4週~6週)

買這商品的人也買了...

相關主題

商品描述

 

<內容簡介>

大數據演算法是大數據得以有效應用的基礎,也是有志於從事大數據以及相關領域工作必須學習的課程。本書由從事大數據研究的專家撰寫,系統地介紹了大數據演算法設計與分析的理論、方法和技術。本書其分為10章,第1童概述大數據演算法,第2章介紹時間亞線性演算法,第3章介紹空間亞線性演算法,第4章概述外存演算法,第5章介紹大數據外存查找結構,第6章講授外存圖數據演算法,第7章概述MapReduce演算法,第8章通過一系列例子講授MapReduce演算法,第9章介紹超越MapReduce的演算法設計方法,第10章討論眾包演算法。
王宏志編著的《大數據演算法》適合作為電腦科學、大數據等專業本科生、研究生教材,也可供從事大數據相關工作的工程技術人員參考。

 

<章節目錄>

前言
第1章  緒論
  1.1  大數據概述
    1.1.1  什麼是大數據
    1.1.2  無處不在的大數據
    1.1.3  大數據的特點
    1.1.4  大數據的應用
  1.2  大數據演算法
    1.2.1  大數據上求解問題的過程
    1.2.2  大數據演算法的定義
    1.2.3  大數據的特點與大數據演算法
    1.2.4  大數據演算法的難度
    1.2.5  大數據演算法的應用
  1.3  大數據演算法設計與分析
    1.3.1  大數據演算法設計技術
    1.3.2  大數據演算法分析技術
  1.4  本書的內容
  習題
第2章  時間亞線性演算法
  2.1  時間亞線性演算法概述
    2.1.1  平面圖直徑問題的亞線性演算法
    2.1.2  排序鏈表搜索的亞線性演算法
    2.1.3  兩個多邊形交集問題的多項式時間演算法
  2.2  最小生成樹代價估計
    2.2.1  連通分量個數估計演算法
    2.2.2  最小生成樹代價估計演算法
  2.3  時間亞線性判定演算法概述
  2.4  數組有序的判定演算法
  2.5  串相等判定演算法
  習題
第3章  空間亞線性演算法
  3.1  空間亞線性演算法概述
  3.2  水庫抽樣
  3.3  尋找頻繁元素的非隨機演算法
    3.3.1  頻繁元素的精確解
    3.3.2  頻繁元素的Misra-Gries演算法
  3.4  估算不同元素的數量
    3.4.1  基本演算法
    3.4.2  改進演算法
  3.5  尋找頻繁元素的隨機演算法
    3.5.1  略圖法
    3.5.2  計數-最小略圖
  3.6  估計頻率矩
    3.6.1  頻率矩的AMS估計演算法
    3.6.2  基於拔河略圖的頻率矩估計
    3.6.3  使用穩定分佈估計範數
  習題
第4章  外存演算法概述
  4.1  外存存儲結構與外存演算法概述
  4.2  外存演算法示例:外存排序演算法

    4.2.1  外存歸併排序演算法
    4.2.2  外存多路快速排序演算法
    4.2.3  外存計算的下界
  4.3  外存數據結構示例:外存搜索樹
  習題
第5章  外存查找結構
  5.1  B樹
  5.2  加權平衡B樹
  5.3  持久B樹
  5.4  緩存樹
  5.5  KDB樹
  5.6  0樹
  習題
第6章  外存圖數據演算法
  6.1  線性表排名及其應用
    6.1.1  線性表排名問題
    6.1.2  歐拉迴路
    6.1.3  父子關係判定
    6.1.4  前序計數
    6.1.5  計算子樹大小
  6.2  時間前向處理方法
    6.2.1  DAG形式邏輯表達式計算問題
    6.2.2  最大獨立集合演算法
  6.3  縮圖法
    6.3.1  基於縮圖法的圖連通分量計算半外存演算法
    6.3.2  基於縮圖法的圖連通分量計算全外存演算法
    6.3.3  最小生成樹演算法
  6.4  廣度優先搜索和深度優先
    搜索
    6.4.1  有向圖的BFS和DFS
    6.4.2  無向圖的BFS
    6.4.3  無向圖更高效的BFS演算法
  6.5  單源最短路徑
    6.5.1  競賽樹
    6.5.2  Dijkstra演算法的I∕0高效版本
  習題
第7章  MapReduce演算法概述
  7.1  MapReduce基礎
    7.1.1  MapReduce的基本模型
    7.1.2  mapper和reducer
    7.1.3  partitioner與combiner
  7.2   MapRedtace演算法設計方法
    7.2.1  局部聚合
    7.2.2  兩種重要的演算法設計模式——詞對法和條塊法
    7.2.3  二次排序
    7.2.4  MapReduce演算法設計與演算法實現技巧
  習題
第8章  MapReduce演算法例析
  8.1  連接演算法
    8.1.1  普通連接演算法
  8.1.2  相似連接演算法
  8.2  圖演算法
    8.2.1  基於廣度優先搜索的MapRedtlee圖處理演算法
    8.2.2  PageRank的MapReduce演算法
    8.2.3  最小生成樹的MapRecluce演算法
    8.2.4  使用圖演算法的註意事項
  習題
第9章  超越MapReduce的並行大數據處理
  9.1  基於迭代處理平臺的並行演算法
  9.2  基於圖處理平臺的並行演算法
    9.2.1  並行結點計算
    9.2.2  並行結點計算的平臺
    9.2.3  基於並行結點計算的單源最短路徑演算法的設計與實現
    9.2.4  計算子圖同構
  習題
第10章  眾包演算法
  10.1  眾包的定義
  10.2  眾包的實例
  10.3  眾包的要素和關鍵技術
    10.3.1  眾包的流程
    10.3.2  眾包的報酬
    10.3.3  眾包中的關鍵技術
  10.4  眾包演算法例析
  習題
參考文獻

 

<作者介紹>

編者:王宏志