數據挖掘原理與應用——以石油勘探開發為例

宋弢 李昕 主編 馬力 王爽 王森 周於皓 張琛 副主編

  • 出版商: 清華大學
  • 出版日期: 2025-09-01
  • 售價: $354
  • 語言: 簡體中文
  • 頁數: 296
  • ISBN: 7302703426
  • ISBN-13: 9787302703426
  • 相關分類: Data-mining
  • 下單後立即進貨 (約4週~6週)

  • 數據挖掘原理與應用——以石油勘探開發為例-preview-1
  • 數據挖掘原理與應用——以石油勘探開發為例-preview-2
  • 數據挖掘原理與應用——以石油勘探開發為例-preview-3
  • 數據挖掘原理與應用——以石油勘探開發為例-preview-4
  • 數據挖掘原理與應用——以石油勘探開發為例-preview-5
  • 數據挖掘原理與應用——以石油勘探開發為例-preview-6
  • 數據挖掘原理與應用——以石油勘探開發為例-preview-7
數據挖掘原理與應用——以石油勘探開發為例-preview-1

相關主題

商品描述

"本書以數據挖掘為核心主線,結合石油勘探開發的實際應用深入探討數據挖掘技術的基礎知識、原理和技術。內容上既註重理論原理的闡述,又強調數學基礎的培養,同時融合實踐應用,使學生能夠全面掌握數據挖掘的核心概念和算法。本書采用Python作為實現語言,對算法的實現進行具體闡述,旨在提高學生的實踐能力和應用水平。 本書分為11章。第1、2章為數據挖掘概述和數據倉庫基本概念; 第3、4章分別為數據預處理和可視化,培養學生的數據處理技能; 第5、6章從分類、預測和聚類角度培養學生的數據歸納技能; 第7~10章分別為關聯規則挖掘、文本抽取算法、推薦算法和網絡數據挖掘,通過常見案例啟發學生的數據底層規律發掘技能; 第11章為綜合案例。 本書結合數據挖掘基本原理與石油勘探開發過程的應用案例,適合能源類高校的計算機相關專業或石油相關專業本科生、研究生以及相關專業人員閱讀使用。 "

作者簡介

宋弢,教授、博士生導師,長期從事生物計算理論、模型與裝置研究,並在藥物研發、藥物裝載等領域開展應用。主持國家級青年人才項目 1 項,國家級科研項目 3 項,省部級人才項目 2 項,省部級科研項目 11 項,主持歐盟 Horizon 2020 項目子課題 1 項,參與其他國家及省部級科研項目 7 項,承擔/參與山東省教改項目重點類項目1項,一般項目2項。在 Nanoscale,Information Sciences,AAAI(CCFA 類)等國內外重要學術期刊和會議發表學術論文 70 余篇。研究成果獲教育部自然科學一等獎 1 項、科技進步二等獎 1 項,中國計算機學會 CCF 科技進步傑出獎 1 項,國際膜計算學會**應用成果獎 1 項,第 48 屆日內瓦國際發明銀獎 1 項,山東省高等教育教學成果獎一等獎1項,校級教學成果獎一等獎、二等獎各1項。主編出版國內第一本智能藥物研發中文專著《智能藥物研發——新藥研發中的人工智能》(2022 年清華大學出版社出版,入選京東圖書年度熱銷榜),譯著國內第一本膜計算譯著《膜計算導論》,編著英文學術專著《Bio-inspired Computing Models and Applications》。

目錄大綱

目錄

 

 

第1章數據挖掘概述

 

1.1基本概念

 

1.1.1數據挖掘基本概念

 

1.1.2數據挖掘發展簡史

 

1.1.3數據挖掘的特點

 

1.2數據挖掘系統的一般結構

 

1.2.1數據挖掘系統的體系結構

 

1.2.2數據挖掘步驟

 

1.3數據挖掘面臨的主要問題

 

1.3.1挖掘方法所面臨的問題

 

1.3.2用戶交互性的問題

 

1.3.3應用與社會影響

 

1.4數據挖掘的常用方法

 

1.4.1基於統計學習的數據挖掘方法

 

1.4.2基於機器學習的數據挖掘方法

 

1.4.3數據挖掘的衡量標準

 

1.5數據挖掘與石油勘探開發

 

第2章基於數據倉庫的數據挖掘

 

2.1數據倉庫概述

 

2.1.1數據倉庫的產生

 

2.1.2數據倉庫的定義

 

2.1.3數據倉庫的發展

 

2.1.4數據庫、數據倉庫和數據挖掘的關系

 

2.1.5數據倉庫系統的組成

 

2.2多維數據模型

 

2.2.1數據立方體

 

2.2.2典型的OLAP操作

 

2.2.3常用的多維數據模型

 

2.3數據倉庫設計

 

2.3.1數據倉庫的設計方法

 

2.3.2數據倉庫的設計過程

 

第3章數據預處理

 

3.1認識數據

 

3.1.1數據對象與數據屬性

 

3.1.2數據的基本統計描述

 

3.2預處理的必要性

 

3.3數據清理

 

3.3.1數據缺失的處理

 

3.3.2噪聲數據的處理

 

3.3.3數據清理過程

 

3.4數據集成和變換

 

3.4.1數據集成

 

3.4.2數據變換

 

3.5數據歸約

 

3.5.1維歸約

 

3.5.2數據壓縮

 

3.5.3數值歸約

 

3.5.4數據離散化和概念分層

 

第4章數據可視化

 

4.1數據可視化概論

 

4.2視覺感知與認知

 

4.2.1格式塔理論

 

4.2.2視覺通道

 

4.3數據分析與探索

 

4.3.1數據屬性

 

4.3.2數據初探

 

4.3.3數據預處理

 

4.3.4數據存儲

 

4.3.5數據分析

 

4.4數據可視化流程

 

4.4.1數據可視化流程

 

4.4.2數據處理和數據變換

 

4.4.3可視化編碼

 

4.5時空數據可視化

 

4.5.1一維標量數據可視化

 

4.5.2二維標量數據可視化

 

4.5.3三維標量數據可視化

 

4.6層次和網絡數據可視化

 

4.6.1樹和圖與可視化

 

4.6.2層次數據可視化

 

4.6.3網絡數據可視化

 

4.7可視化工具

 

4.8綜合案例——氣井產量預測分析

 

4.8.1項目簡介

 

4.8.2數據集說明

 

4.8.3數據整體分析

 

4.8.4外輸壓力和日產氣量關聯分析

 

4.8.5產水量和日產氣量的關聯分析

 

4.8.6生產時間和日產氣量的關聯分析

 

4.8.7氣嘴直徑和日產氣量的關聯分析

 

4.8.8平均油壓、平均套壓和日產氣量

 

第5章分類與預測

 

5.1分類的基本過程

 

5.2分類模型的構造方法

 

5.2.1數據準備

 

5.2.2分類方法

 

5.2.3方法評估標準

 

5.3基於決策樹(判定樹)的分類

 

5.3.1決策樹分類步驟

 

5.3.2決策樹ID3算法

 

5.3.3屬性選擇方法

 

5.3.4基本決策樹方法的改進

 

5.3.5樹剪枝

 

5.3.6由決策樹(判定樹)提取分類規則

 

5.3.7決策樹歸納的可擴展性

 

5.4其他分類方法

 

5.4.1K最鄰近(近鄰)分類

 

5.4.2基於統計的分類策略

 

第6章聚類分析

 

6.1聚類分析的概念

 

6.1.1基本概念

 

6.1.2聚類分析原理

 

6.1.3聚類的主要應用

 

6.2聚類分析算法分類

 

6.2.1按照聚類標準

 

6.2.2按照聚類算法所處理的數據類型

 

6.2.3按照聚類的尺度

 

6.2.4按照聚類算法的思路

 

6.3聚類分析中的數據類型

 

6.3.1基本的數據結構

 

6.3.2標準化

 

6.3.3數值型數據的相異性度量

 

6.3.4其他類型的變量相似性值

 

6.4主要聚類方法

 

6.4.1層次方法

 

6.4.2劃分方法

 

6.4.3基於密度的聚類方法

 

6.4.4基於網格的聚類方法

 

6.4.5基於模型的聚類方法

 

6.4.6模糊聚類算法FCM

 

第7章關聯規則挖掘

 

7.1基本概念

 

7.1.1購物籃問題分析

 

7.1.2頻繁項集和關聯規則

 

7.1.3關聯規則挖掘的應用

 

7.1.4關聯規則挖掘分類

 

7.2關聯規則挖掘方法

 

7.2.1關聯規則挖掘基本過程

 

7.2.2Apriori算法

 

7.2.3由頻繁項集產生關聯規則

 

7.2.4Apriori算法的改進思路

 

7.3挖掘頻繁項集的模式增長方法

 

7.3.1FPtree的構建

 

7.3.2FPGrowth算法

 

7.4多種關聯規則挖掘

 

7.4.1多層關聯規則挖掘

 

7.4.2多維關聯規則挖掘

 

7.5關聯模式評估

 

7.5.1客觀興趣度度量

 

7.5.2辛普森悖論

 

第8章文本抽取算法

 

8.1潛在語義分析應用背景

 

8.2創建單詞文檔矩陣

 

8.3TFIDF修改權重

 

8.4SVD矩陣分析

 

8.5相似度計算

 

8.6文獻檢索

 

8.7數學基礎

 

8.7.1特征值和特征向量

 

8.7.2SVD求解

 

8.7.3SVD的幾何意義

 

第9章推薦算法

 

9.1推薦算法概述

 

9.2冷啟動問題

 

9.2.1利用非個性化推薦

 

9.2.2利用用戶註冊信息

 

9.2.3利用物品的內容信息

 

9.2.4根據用戶的手機信息

 

9.3推薦算法分類

 

9.3.1根據推薦結果是否具有個性化

 

9.3.2根據推薦引擎的數據源

 

9.3.3根據推薦模型的建立方式

 

9.3.4混合推薦算法

 

9.4協同過濾

 

9.4.1基於用戶的協同過濾

 

9.4.2基於物品的協同過濾

 

9.4.3UserCF和ItemCF

 

9.4.4基於模型的協同過濾

 

9.5綜合案例: 基於用戶的協同過濾

 

第10章網絡數據挖掘

 

10.1引言

 

10.2網絡的定義與表示

 

10.2.1網絡的定義

 

10.2.2圖的鄰接矩陣表示

 

10.2.3網絡的類型

 

10.3網絡的基本性質

 

10.3.1路徑與連通性

 

10.3.2結點的度和度分布

 

10.3.3聚類系數

 

10.3.4無標度網絡與小世界網絡

 

10.4網絡結點的中心性

 

10.4.1度中心性

 

10.4.2介數中心性

 

10.4.3接近中心性

 

10.4.4特征向量中心性

 

10.4.5Katz中心性

 

10.4.6PageRank算法

 

10.5鏈路預測與相似性度量

 

10.5.1問題定義和評價指標

 

10.5.2共同鄰居

 

10.5.3優先鏈接指標

 

10.5.4AdamicAdar指標

 

10.5.5資源分配指標

 

10.5.6局部和全局路徑指標

 

10.5.7鏈路預測算法實例分析

 

10.6社團檢測算法

 

10.6.1模塊度

 

10.6.2CNM社團檢測算法

 

第11章頁巖油壓裂水平井產能數據挖掘分析

 

11.1技術背景

 

11.2頁巖油井產能數據的特征

 

11.3頁巖油井產能數據預處理方法

 

11.3.1數據清洗

 

11.3.2頁巖油產能主要控制因素篩選

 

11.4頁巖油井產能/生產動態預測

 

11.4.1非時間序列型模型

 

11.4.2時間序列型模型

 

11.5實例分析

 

11.5.1非時間序列型模型

 

11.5.2時間序列型模型

 

參考文獻