買這商品的人也買了...
-
Arduino UNO R3 開發板(副廠相容版)附傳輸線$400$380 -
$403AWS Lambda 實戰 : 開發事件驅動的無服務器應用程序 (AWS Lambda in Action: Event-Driven Serverless Applications) -
$254亞馬遜 AWS 雲基礎與實戰 -
$352關聯數據:萬維網上的結構化數據 -
大數據時代一定要會的 SQL 商業資料分析術$680$578 -
$594實戰 Python 網絡爬蟲 -
Python 爬蟲技術 — 深入理解原理、技術與開發$534$507 -
$454Python 3 反爬蟲原理與繞過實戰 -
$284Python3爬蟲實戰:數據清洗、數據分析與可視化 -
$454ECharts 數據可視化:入門、實戰與進階 -
深度強化式學習 (Deep Reinforcement Learning in Action)$1,000$790 -
必學!Python 資料科學‧機器學習最強套件 - NumPy、Pandas、Matplotlib、OpenCV、scikit-learn、tf.Keras$680$537 -
最踏實 AI 之路:全白話機器學習一次搞懂$780$616 -
人工智慧再進化:聯邦學習讓資料更安全穩固$880$695 -
$422Python 深度強化學習入門:強化學習和深度學習的搜索與控制 -
數位影像處理-Python 程式實作, 3/e (附範例光碟)$600$540 -
Python 從初學到生活應用超實務 (電腦視覺與AI加強版):讓 Python 幫你處理日常生活與工作中繁瑣重複的工作$650$507 -
動手學 GitHub!現代人不能不知道的協同合作平台$600$474 -
數位與醫學的人工智慧影像處理技術:Python 實務$580$452 -
Arduino 專題製作與應用:Python 連線控制篇$500$390 -
Python 資料科學實戰教本 - 爬蟲、清理、資料庫、視覺化、探索式分析、機器學習建模,數據工程一次搞定!$680$537 -
Python AI 人員必修的科學計算 - 數學、機率、統計、演算$880$695 -
Python 金融市場賺大錢聖經:寫出你的專屬指標, 2/e$780$616 -
AI 神助攻!程式設計新境界 – GitHub Copilot 開發 Python 如虎添翼 : 提示工程、問題分解、測試案例、除錯$560$442 -
AI 工具使用手冊:學會 AI 魔法讓你變身超人不再當麻瓜$690$545
中文年末書展|繁簡參展書2書75折 詳見活動內容 »
-
75折
為你寫的 Vue Components:從原子到系統,一步步用設計思維打造面面俱到的元件實戰力 (iThome 鐵人賽系列書)$780$585 -
75折
BDD in Action, 2/e (中文版)$960$720 -
75折
看不見的戰場:社群、AI 與企業資安危機$750$563 -
79折
AI 精準提問 × 高效應用:DeepSeek、ChatGPT、Claude、Gemini、Copilot 一本搞定$390$308 -
7折
超實用!Word.Excel.PowerPoint 辦公室 Office 365 省時高手必備 50招, 4/e (暢銷回饋版)$420$294 -
75折
裂縫碎光:資安數位生存戰$550$412 -
85折
日本當代最強插畫 2025 : 150位當代最強畫師豪華作品集$640$544 -
79折
Google BI 解決方案:Looker Studio × AI 數據驅動行銷實作,完美整合 Google Analytics 4、Google Ads、ChatGPT、Gemini$630$498 -
79折
超有料 Plus!職場第一實用的 AI 工作術 - 用對 AI 工具、自動化 Agent, 讓生產力全面進化!$599$473 -
75折
從零開始學 Visual C# 2022 程式設計, 4/e (暢銷回饋版)$690$518 -
75折
Windows 11 制霸攻略:圖解 AI 與 Copilot 應用,輕鬆搞懂新手必學的 Windows 技巧$640$480 -
75折
精準駕馭 Word!論文寫作絕非難事 (好評回饋版)$480$360 -
Sam Yang 的插畫藝術:用 Procreate / PS 畫出最強男友視角 x 女孩美好日常$699$629 -
79折
AI 加持!Google Sheets 超級工作流$599$473 -
78折
想要 SSR? 快使用 Nuxt 吧!:Nuxt 讓 Vue.js 更好處理 SEO 搜尋引擎最佳化(iThome鐵人賽系列書)$780$608 -
75折
超實用!業務.總管.人資的辦公室 WORD 365 省時高手必備 50招 (第二版)$500$375 -
7折
Node-RED + YOLO + ESP32-CAM:AIoT 智慧物聯網與邊緣 AI 專題實戰$680$476 -
79折
「生成式⇄AI」:52 個零程式互動體驗,打造新世代人工智慧素養$599$473 -
7折
Windows APT Warfare:惡意程式前線戰術指南, 3/e$720$504 -
75折
我輩程式人:回顧從 Ada 到 AI 這條程式路,程式人如何改變世界的歷史與未來展望 (We, Programmers: A Chronicle of Coders from Ada to AI)$850$637 -
75折
不用自己寫!用 GitHub Copilot 搞定 LLM 應用開發$600$450 -
79折
Tensorflow 接班王者:Google JAX 深度學習又快又強大 (好評回饋版)$780$616 -
79折
GPT4 會你也會 - 共融機器人的多模態互動式情感分析 (好評回饋版)$700$553 -
79折
技術士技能檢定 電腦軟體應用丙級術科解題教本|Office 2021$460$363 -
75折
Notion 與 Notion AI 全能實戰手冊:生活、學習與職場的智慧策略 (暢銷回饋版)$560$420
相關主題
商品描述
本書是一本通過實戰教初學者學習爬取數據、清洗和組織數據進行分析和可視化的Python讀物。
書中案例均經過實戰檢驗,筆者在實踐過程中深感採集數據、清洗和組織數據的重要性,
作為一名數據行業的“碼農”,數據就是沃土,沒有數據,我們將無田可耕。
本書共13章,包括6個核心主題,其一是Python基礎入門,包括環境配置、基本操作、
數據類型、語句和函數;其二是Python爬蟲的構建,包括網頁結構解析、爬蟲流程設計、
代碼優化、爬蟲效率優化、無線端的數據採集、容錯處理、反防爬蟲、表單交互和模擬頁麵點擊;
其三是Python數據庫應用,包括MongoDB、MySQL在Python中的連接與應用;
其四是數據清洗和組織,包括NumPy數組知識,以及pandas數據的讀寫、分組、
變形,缺失值、異常值和重複值處理,時序數據處理和正則表達式的使用等;
其五是綜合應用實例,幫助讀者貫穿爬蟲、數據清洗與組織的過程;
最後是數據可視化,包括matplotlib和pyecharts兩個庫的使用,
涉及餅圖、柱形圖、線圖、詞雲圖等圖形,幫助讀者進入可視化的殿堂。
本書以實戰為主,適合Python初學者及高等院校相關專業的學生閱讀,也適合Python培訓機構作為實驗教材。
作者簡介
韓要賓
杭州沐垚科技有限公司COO,CDA數據分析研究院資深講師,
具有5年電商從業經驗,4年數據挖掘實戰經驗,專註於數據分析與挖掘、機器學習、深度學習的研究。
服務客戶:蘇寧易購、Decathlon、百草味、浙江師範大學等。
目錄大綱
目錄
第1章Python語言基礎
1.1安裝Python環境
1.1.1 Python 3.6.2安裝與配置
1.1.2使用IDE工具——PyCharm
1.1.3使用IDE工具——Anaconda
1.2 Python操作入門
1.2.1編寫第一個Python代碼
1.2.2 Python基本操作
1.2.3變量
1.3 Python數據類型
1.3.1數字
1.3.2字符串
1.3.3列表
1.3.4元組
1.3.5集合
1.3.6字典
1.4 Python語句與函數
1.4.1條件語句
1.4.2循環語句
1.4.3函數
1.5習題
第2章數據採集的基本知識
2.1關於爬蟲的合法性
2.2瞭解網頁
2.2.1認識網頁結構
2.2.2寫一個簡單的HTML
2.3使用requests庫請求網站
2.3.1安裝requests庫
2.3.2爬蟲的基本原理
2.3.3使用GET方式抓取數據
2.3.4使用POST方式抓取數據
2.4使用Beautiful Soup解析網頁
2.5清洗和組織數據
2.6爬蟲攻防戰
2.7關於什麼時候存儲數據
2.8習題
第3章用API爬取天氣預報數據
3.1註冊免費API和閱讀技術文檔
3.2獲取API數據
3.3存儲數據到MongoDB
3.3.1下載並安裝MongoDB
3.3.2在PyCharm中安裝Mongo Plugin
3.3.3將數據存入MongoDB中
3.4 MongoDB數據庫查詢
3.5習題
第4章大型爬蟲案例:抓取某電商網站的商品數據
4.1觀察頁面特徵和解析數據
4.2工作流程分析
4.3構建類目樹
4.4獲取景點產品列表
4.5代碼優化
4.6爬蟲效率優化
4.7容錯處理
4.8習題
第5章採集手機App數據
5.1模擬器及抓包環境配置
5.2 App數據抓包
5.3手機App數據的採集
5.4習題
第6章Scrapy爬蟲
6.1 Scrapy簡介
6.2安裝Scrapy
6.3案例:用Scrapy抓取股票行情
6.4習題
第7章Selenium爬蟲
7.1 Selenium簡介
7.2安裝Selenium
7.3 Selenium定位及操作元素
7.4案例:用Selenium抓取某電商網站數據
7.5習題
第8章爬蟲案例集錦
8.1採集外賣平臺數據
8.1.1採集目標
8.1.2採集代碼
8.2採集內容平臺數據
8.2.1採集目標
8.2.2採集代碼
8.3採集招聘平臺數據
8.3.1採集目標
8.3.2採集代碼
8.4採集知識付費平臺數據
8.4.1採集目標
8.4.2採集代碼
第9章數據庫連接和查詢
9.1使用PyMySQL
9.1.1連接數據庫
9.1.2案例:某電商網站女裝行業TOP100銷量數據
9.2使用SQLAlchemy
9.2.1 SQLAlchemy基本介紹
9.2. 2 SQLAlchemy基本語法
9.3 MongoDB
9.3.1 MongoDB基本語法
9.3.2案例:在某電商網站搜索“連衣裙”的商品數據
9.4習題
第10章NumPy數組操作
10.1 NumPy簡介
10.2一維數組
10.2.1數組與列表的異同
10.2.2數組的創建
10.3多維數組
10.3.1多維數組的高效性能
10.3.2多維數組的索引與切片
10.3.3多維數組的屬性和方法
10.4數組的運算
10.5習題
第11章pandas數據清洗
11.1數據讀寫、選擇、整理和描述
11.1.1從CSV中讀取數據
11.1.2向CSV中寫入數據
11.1.3數據選擇
11.1.4數據整理
11.1.5數據描述
11.2數據分組、分割、合併和變形
11.2.1數據分組
11.2.2數據分割
11.2.3數據合併
11.2.4數據變形
11.2.5案例:旅遊數據的分析與變形
11.3缺失值、異常值和重複值處理
11.3.1缺失值處理
11.3.2檢測和過濾異常值
11.3.3移除重複值
11.3.4案例:旅遊數據值的檢查與處理
11.4時序數據處理
11.4.1日期/時間數據轉換
11.4.2時序數據基礎操作
11.4.3案例:天氣預報數據分析與處理
11.5數據類型轉換
11.6正則表達式
11.6.1元字符與限定符
11.6.2案例:用正則表達式提取網頁文本信息
11.7習題
第12章綜合應用實例
12.1按性價比給用戶推薦旅遊產品
12.1.1數據採集
12.1.2數據清洗、建模
12.2通過熱力圖分析為用戶提供出行建議
12.2.1某旅遊網站熱門景點爬蟲代碼
12.2.2提取CSV文件中經緯度和銷量信息
12.2.3創建景點門票銷量熱力圖HTML文件
第13章數據可視化
13.1應用matplotlib畫圖
13.1.1畫出各省份平均價格、各省份平均成交量柱狀圖
13.1.2畫出各省份平均成交量折線圖、柱狀圖、箱形圖和餅圖
13.1.3畫出價格與成交量的散點圖
13.2應用pyecharts畫圖
13.2.1 Echarts簡介
13.2.2 pyecharts簡介
13.2.3初識pyecharts,玫瑰相送
13.2. 4 pyecharts基本語法
13.2.5基於商業分析的pyecharts圖
