數據準備和特徵工程 — 數據工程師必知必會技能
齊偉
- 出版商: 電子工業
- 出版日期: 2020-03-01
- 定價: $270
- 售價: 7.9 折 $213
- 語言: 簡體中文
- 裝訂: 平裝
- ISBN: 7121382636
- ISBN-13: 9787121382635
-
相關分類:
DeepLearning、Data-mining
立即出貨
買這商品的人也買了...
-
挑戰 PHP7/MySQL 程式設計與超強專題特訓班, 4/e (適用PHP5~7,MariaDB)$550$468 -
$403Python 網絡爬蟲實戰, 2/e -
$709微服務架構設計模式 (Microservices Patterns: With examples in Java) -
$280特徵工程入門與實踐 (Feature Engineering Made Easy) -
Pandas 資料分析實戰:使用 Python 進行高效能資料處理及分析 (Learning pandas : High-performance data manipulation and analysis in Python, 2/e)$580$452 -
$507Python 爬蟲技術 — 深入理解原理、技術與開發 -
$507微服務容器化開發實戰 -
精通機器學習|使用 Scikit-Learn , Keras 與 TensorFlow, 2/e (Hands-on Machine Learning with Scikit-Learn, Keras, and TensorFlow, 2/e)$1,200$948 -
$2965G+醫療:新技術如何改變醫療產業商業模式 -
$658Angular 應用程序開發指南 -
$505微軟 Azure 實戰參考 -
$439數據中臺架構:企業數據化最佳實踐 -
深度學習 -- 硬體設計$750$675 -
$378數據分析通識 -
$352數據中臺實戰:手把手教你搭建數據中臺 -
$534算法與數據中台:基於 Google、Facebook 與微博實踐 -
$454自動機器學習 (AutoML):方法、系統與挑戰 -
中臺架構與實現:基於 DDD 和微服務$534$507 -
使用 AWS 在雲端建置 Linux 伺服器的 20堂課$500$395 -
$796瘋狂 Spring Boot 終極講義 -
$454數據中臺建設:從方法論到落地實戰 -
資料科學的統計實務 : 探索資料本質、扎實解讀數據,才是機器學習成功建模的第一步$599$539 -
$1,010人工智能硬件電路設計基礎及應用 -
$1,0195G 大規模天線增強技術 -
$458特徵工程的藝術:通用技巧與實用案例
中文年末書展|繁簡參展書2書75折 詳見活動內容 »
-
75折
為你寫的 Vue Components:從原子到系統,一步步用設計思維打造面面俱到的元件實戰力 (iThome 鐵人賽系列書)$780$585 -
75折
BDD in Action, 2/e (中文版)$960$720 -
75折
看不見的戰場:社群、AI 與企業資安危機$750$563 -
79折
AI 精準提問 × 高效應用:DeepSeek、ChatGPT、Claude、Gemini、Copilot 一本搞定$390$308 -
7折
超實用!Word.Excel.PowerPoint 辦公室 Office 365 省時高手必備 50招, 4/e (暢銷回饋版)$420$294 -
75折
裂縫碎光:資安數位生存戰$550$412 -
日本當代最強插畫 2025 : 150位當代最強畫師豪華作品集$640$576 -
79折
Google BI 解決方案:Looker Studio × AI 數據驅動行銷實作,完美整合 Google Analytics 4、Google Ads、ChatGPT、Gemini$630$498 -
79折
超有料 Plus!職場第一實用的 AI 工作術 - 用對 AI 工具、自動化 Agent, 讓生產力全面進化!$599$473 -
75折
從零開始學 Visual C# 2022 程式設計, 4/e (暢銷回饋版)$690$518 -
75折
Windows 11 制霸攻略:圖解 AI 與 Copilot 應用,輕鬆搞懂新手必學的 Windows 技巧$640$480 -
75折
精準駕馭 Word!論文寫作絕非難事 (好評回饋版)$480$360 -
Sam Yang 的插畫藝術:用 Procreate / PS 畫出最強男友視角 x 女孩美好日常$699$629 -
79折
AI 加持!Google Sheets 超級工作流$599$473 -
78折
想要 SSR? 快使用 Nuxt 吧!:Nuxt 讓 Vue.js 更好處理 SEO 搜尋引擎最佳化(iThome鐵人賽系列書)$780$608 -
78折
超實用!業務.總管.人資的辦公室 WORD 365 省時高手必備 50招 (第二版)$500$390 -
7折
Node-RED + YOLO + ESP32-CAM:AIoT 智慧物聯網與邊緣 AI 專題實戰$680$476 -
79折
「生成式⇄AI」:52 個零程式互動體驗,打造新世代人工智慧素養$599$473 -
7折
Windows APT Warfare:惡意程式前線戰術指南, 3/e$720$504 -
75折
我輩程式人:回顧從 Ada 到 AI 這條程式路,程式人如何改變世界的歷史與未來展望 (We, Programmers: A Chronicle of Coders from Ada to AI)$850$637 -
75折
不用自己寫!用 GitHub Copilot 搞定 LLM 應用開發$600$450 -
79折
Tensorflow 接班王者:Google JAX 深度學習又快又強大 (好評回饋版)$780$616 -
79折
GPT4 會你也會 - 共融機器人的多模態互動式情感分析 (好評回饋版)$700$553 -
79折
技術士技能檢定 電腦軟體應用丙級術科解題教本|Office 2021$460$363 -
75折
Notion 與 Notion AI 全能實戰手冊:生活、學習與職場的智慧策略 (暢銷回饋版)$560$420
相關主題
商品描述
本書詳細地介紹了大數據、人工智能等項目中不可或缺的環節和內容:數據準備和特徵工程。書中的每節首先以簡明方式介紹了基本知識;然後通過實際案例演示了基本知識的實際應用,並提供了針對性練習項目,將“知識、案例、練習”融為一體;最後以“擴展探究”方式引導讀者進入更深廣的領域。本書既適合作為大學相關專業的教材,也適合作為大數據、人工智能等領域的開發人員的參考讀物。
作者簡介
齊偉
自稱老齊,現居蘇州,所著在線教程《零基礎學Python》及《
零基礎學Python(第2版)》在業內引起非常大的反響。
願意和來自各方的朋友討論技術問題,並能提供相關技術服務
目錄大綱
目錄
第1章感知數據............................................ ............... 001
1.0瞭解數據科學項目............................................ ..... 001
1.1文件中的數據............................................ ......... 003
1.1.1CSV文件............................................ ....... 003
1.1.2Excel文件............................................ ..... 009
1.1.3圖像文件............................................ ...... 015
1.2數據庫中的數據............................................ ....... 019
1.3網頁上的數據............................................ ......... 029
1.4來自API的數據............................................ ........ 039
第2章數據清理............................................ ............... 044
2.0基本概念.............................................. ........... 045
2.1轉化數據類型............................................. ........ 046
2.2處理重複數據............................................. ........ 054
2.3處理缺失數據............................................. ........ 057
2.3.1檢查缺失數據........................................... ... 058
2.3.2用指定值填補.......................................... .... 063
2.3.3根據規律填補........................................... ... 069
2.4處理離群數據............................................ ......... 076
第3章特徵變換............................................ ............... 083
3.0特徵的類型............................................. .......... 084
3.1特徵數值化............................................. .......... 085
3.2特徵二值化............................................ ........... 088
3.3OneHot編碼.............................................. ......... 093
3.4數據變換.............................................. ........... 098
3.5特徵離散化............................................. .......... 104
3.5.1無監督離散化.......................................... .... 104
3.5.2有監督離散化.......................................... .... 110
3.6數據規範化.............................................. ......... 113
第4章特徵選擇............................................ ............... 124
4.0特徵選擇簡述............................................ ......... 124
4.1封裝器法............................................. ............ 127
4.1.1循序特徵選擇........................................... ... 127
4.1.2窮舉特徵選擇.......................................... .... 135
4.1.3遞歸特徵消除....................................... 140
4.2過濾器法............................................. .... 144
4.3嵌入法.............................................. ..... 149
第5章特徵抽取............................................ ....... 154
5.1 ① 無監督特徵抽取.......................................... 154
5.1.1主成分分析......................................... 154
5.1.2因子分析........................................... 161
5.2有監督特徵抽取........................................... 167
附錄AJupyter簡介............................................. ... 173
附錄BNumPy簡介............................................. ..... 176
附錄CPandas簡介............................................. .... 185
附錄DMatplotlib簡介............................................. 194
後記 199
