Scikit-learn 機器學習詳解上
潘風文、潘啟儒著
- 出版商: 化學工業
- 出版日期: 2021-01-01
- 定價: $594
- 售價: 8.5 折 $505
- 語言: 簡體中文
- 頁數: 348
- 裝訂: 平裝
- ISBN: 7122378497
- ISBN-13: 9787122378491
-
相關分類:
Machine Learning
立即出貨 (庫存 < 3)
買這商品的人也買了...
-
$359Oracle PL/SQL 必知必會 -
Azure 雲端服務滲透測試攻防實務$520$411 -
Pandas 資料分析實戰:使用 Python 進行高效能資料處理及分析 (Learning pandas : High-performance data manipulation and analysis in Python, 2/e)$580$452 -
$250機器學習線性代數基礎 (Python 語言描述) -
機器學習的數學基礎 : AI、深度學習打底必讀$580$458 -
打下最紮實的 AI基礎:從 scikit-learn 一步一腳印 (絕賣版)$560$476 -
決心打底!Python 深度學習基礎養成$690$587 -
$505模式識別 -
$374Python 數據分析 -
Python 3.9 技術手冊$560$442 -
$403機器學習中的概率統計:Python 語言描述 -
Python 滲透測試實戰$474$450 -
$654深度學習 500問 — AI 工程師面試寶典 -
Kaggle 競賽攻頂秘笈 -- 揭開 Grandmaster 的特徵工程心法,掌握制勝的關鍵技術$1,000$850 -
深度強化式學習 (Deep Reinforcement Learning in Action)$1,000$790 -
$607機器學習導論 -
$269Python 數據挖掘與機器學習 -
力抗暗黑:Azure 資安天使的逆襲(iT邦幫忙鐵人賽系列書)$500$390 -
Deep Learning 3|用 Python 進行深度學習框架的開發實作$780$616 -
資料科學的建模基礎 : 別急著 coding!你知道模型的陷阱嗎?$599$539 -
機器學習的統計基礎 : 深度學習背後的核心技術$680$537 -
機器學習模擬應用|將合成資料運用於AI (Practical Simulations for Machine Learning)$680$537 -
$469精通 Transformer : 從零開始構建最先進的 NLP 模型 -
客戶留存數據分析與預測$768$730 -
駕馭 ChatGPT 4: 探索 Azure OpenAI 與 Cognitive Service for Language 開發實踐 (使用.NET 與 Node.js)$650$507
中文年末書展|繁簡參展書2書75折 詳見活動內容 »
-
75折
為你寫的 Vue Components:從原子到系統,一步步用設計思維打造面面俱到的元件實戰力 (iThome 鐵人賽系列書)$780$585 -
75折
BDD in Action, 2/e (中文版)$960$720 -
75折
看不見的戰場:社群、AI 與企業資安危機$750$563 -
79折
AI 精準提問 × 高效應用:DeepSeek、ChatGPT、Claude、Gemini、Copilot 一本搞定$390$308 -
7折
超實用!Word.Excel.PowerPoint 辦公室 Office 365 省時高手必備 50招, 4/e (暢銷回饋版)$420$294 -
75折
裂縫碎光:資安數位生存戰$550$412 -
85折
日本當代最強插畫 2025 : 150位當代最強畫師豪華作品集$640$544 -
79折
Google BI 解決方案:Looker Studio × AI 數據驅動行銷實作,完美整合 Google Analytics 4、Google Ads、ChatGPT、Gemini$630$498 -
79折
超有料 Plus!職場第一實用的 AI 工作術 - 用對 AI 工具、自動化 Agent, 讓生產力全面進化!$599$473 -
75折
從零開始學 Visual C# 2022 程式設計, 4/e (暢銷回饋版)$690$518 -
75折
Windows 11 制霸攻略:圖解 AI 與 Copilot 應用,輕鬆搞懂新手必學的 Windows 技巧$640$480 -
75折
精準駕馭 Word!論文寫作絕非難事 (好評回饋版)$480$360 -
Sam Yang 的插畫藝術:用 Procreate / PS 畫出最強男友視角 x 女孩美好日常$699$629 -
79折
AI 加持!Google Sheets 超級工作流$599$473 -
78折
想要 SSR? 快使用 Nuxt 吧!:Nuxt 讓 Vue.js 更好處理 SEO 搜尋引擎最佳化(iThome鐵人賽系列書)$780$608 -
78折
超實用!業務.總管.人資的辦公室 WORD 365 省時高手必備 50招 (第二版)$500$390 -
7折
Node-RED + YOLO + ESP32-CAM:AIoT 智慧物聯網與邊緣 AI 專題實戰$680$476 -
79折
「生成式⇄AI」:52 個零程式互動體驗,打造新世代人工智慧素養$599$473 -
7折
Windows APT Warfare:惡意程式前線戰術指南, 3/e$720$504 -
75折
我輩程式人:回顧從 Ada 到 AI 這條程式路,程式人如何改變世界的歷史與未來展望 (We, Programmers: A Chronicle of Coders from Ada to AI)$850$637 -
75折
不用自己寫!用 GitHub Copilot 搞定 LLM 應用開發$600$450 -
79折
Tensorflow 接班王者:Google JAX 深度學習又快又強大 (好評回饋版)$780$616 -
79折
GPT4 會你也會 - 共融機器人的多模態互動式情感分析 (好評回饋版)$700$553 -
79折
技術士技能檢定 電腦軟體應用丙級術科解題教本|Office 2021$460$363 -
75折
Notion 與 Notion AI 全能實戰手冊:生活、學習與職場的智慧策略 (暢銷回饋版)$560$420
相關主題
商品描述
本書主要內容包括機器學習介紹,NumPy、Pandas、SciPy庫、Matplotlib(可視化)四個基礎模塊,
Scikit-learn算法、模型、擬合、過擬合、欠擬合、模型性能度量指標、數據標準化、非線性轉換、離散化,
以及特徵抽取和降維的各種方法,包括特徵哈希、文本特徵抽取、特徵聚合等。
全書通過實用範例和圖解形式講解,選材典型,案例豐富,
適合從事大數據、數據挖掘、機器學習等人工智能領域開發的各類人員。
作者簡介
潘風文
博士,從事大數據、人工智能領域的研究和實踐二十多年,成功主持過多項大型數據倉庫及商業智能BI項目,
包括電商ping臺用戶畫像智能係統,Themis企業徵信盡調ping臺智能係統,武漢農商行數據倉庫DW系統,
金融界大型網站數據分析系統,CGoGo手機搜索引擎,陝西移動BI智能分析系統,
中國電信移動支付系統等,主持過數據挖掘人工智能領域多項國家科研項目。
目錄大綱
1 機器學習 1
1.1 機器學習和人工智能 2
1.2 機器學習和大數據 4
1.3 機器學習和數據挖掘 6
1.4 機器學習分類和應用 7
1.5 機器學習開發步驟 10
1.5.1 數據挖掘標準流程 10
1.5.2 機器學習開發步驟 15
本章小結 18
2 Scikit-learn預備知識 20
2.1 NumPy 21
2.1.1 NumPy數組概念 23
2.1.2 NumPy數據類型 24
2.1.3 NumPy數組創建 26
2.1.4 NumPy數組操作 37
2.1.5 NumPy隨機數 51
2.1.6 NumPy輸入輸出 57
2.1.7 NumPy矩陣 58
2.1.8 NumPy線性代數 59
2.1.9 NumPy常數 63
2.2 Pandas 63
2.2.1 Pandas數據結構 64
2.2.2 Pandas頂層函數 114
2.2.3 Pandas應用舉例 115
2.3 SciPy庫 122
2.3.1 SciPy庫基礎知識 123
2.3.2 稀疏矩陣及其處理 124
2.3.3 SciPy庫應用舉例 138
2.4 Matplotlib 144
2.4.1 Matplotlib基礎知識 145
2.4.2 Matplotlib應用舉例 149
本章小結 161
3 Scikit-learn基礎應用 163
3.1 機器學習的算法和模型 164
3.1.1 特徵變量和目標變量 165
3.1.2 算法訓練 166
3.1.3 過擬合和欠擬合 174
3.1.4 模型性能度量 175
3.2 模型選擇 180
3.3 Scikit-learn的功能模塊 180
3.4 Scikit-learn 應用 182
3.4.1 安裝Scikit-learn 182
3.4.2 數據導入 183
3.4.3 模型持久化 185
3.4.4 文本數據處理 186
3.4.5 隨機狀態控制 187
3.4.6 分類型變量處理 187
3.4.7 Pandas數據框處理 188
3.4.8 輸入輸出約定 188
3.5 應用實例 191
本章小結 193
4 Scikit-learn數據變換 195
4.1 概念介紹 196
4.1.1 評估器(estimator) 196
4.1.2 轉換器(transformer) 197
4.1.3 管道(pipeline) 198
4.2 數據預處理 199
4.2.1 數據標準化 201
4.2.2 數據非線性轉換 223
4.2.3 數據歸一化 232
4.2.4 分類型特徵變量編碼 237
4.2.5 數據離散化 245
4.2.6 特徵組合 251
4.3 缺失值處理 254
4.3.1 單變量插補 255
4.3.2 多變量插補 258
4.3.3 最近鄰插補 262
4.3.4 標記插補缺失值 264
4.4 目標變量預處理 268
4.4.1 多類別分類標籤二值化 268
4.4.2 多標籤分類標籤二值化 273
4.4.3 目標變量標籤編碼 276
本章小結 279
5 Scikit-learn特徵抽取和降維 281
5.1 特徵抽取 282
5.1.1 字典列表對象向量化 283
5.1.2 特徵哈希 286
5.1.3 文本特徵抽取 291
5.1.4 圖像特徵抽取 316
5.2 特徵降維 320
5.2.1 主成分分析 321
5.2.2 特徵聚合 326
5.2.3 隨機投影 330
本章小結 340
附錄 342
1. 互操作和框架增強包 343
2. 評估器和任務擴展包 344
3. 統計知識擴展包 347
4. 推薦引擎擴展包 347
5. 特定領域的擴展包 347
