中文年末書展|繁簡參展書2書75折 詳見活動內容 »
-
75折
為你寫的 Vue Components:從原子到系統,一步步用設計思維打造面面俱到的元件實戰力 (iThome 鐵人賽系列書)$780$585 -
75折
BDD in Action, 2/e (中文版)$960$720 -
75折
看不見的戰場:社群、AI 與企業資安危機$750$563 -
79折
AI 精準提問 × 高效應用:DeepSeek、ChatGPT、Claude、Gemini、Copilot 一本搞定$390$308 -
7折
超實用!Word.Excel.PowerPoint 辦公室 Office 365 省時高手必備 50招, 4/e (暢銷回饋版)$420$294 -
75折
裂縫碎光:資安數位生存戰$550$412 -
日本當代最強插畫 2025 : 150位當代最強畫師豪華作品集$640$576 -
79折
Google BI 解決方案:Looker Studio × AI 數據驅動行銷實作,完美整合 Google Analytics 4、Google Ads、ChatGPT、Gemini$630$498 -
79折
超有料 Plus!職場第一實用的 AI 工作術 - 用對 AI 工具、自動化 Agent, 讓生產力全面進化!$599$473 -
75折
從零開始學 Visual C# 2022 程式設計, 4/e (暢銷回饋版)$690$518 -
75折
Windows 11 制霸攻略:圖解 AI 與 Copilot 應用,輕鬆搞懂新手必學的 Windows 技巧$640$480 -
75折
精準駕馭 Word!論文寫作絕非難事 (好評回饋版)$480$360 -
Sam Yang 的插畫藝術:用 Procreate / PS 畫出最強男友視角 x 女孩美好日常$699$629 -
79折
AI 加持!Google Sheets 超級工作流$599$473 -
78折
想要 SSR? 快使用 Nuxt 吧!:Nuxt 讓 Vue.js 更好處理 SEO 搜尋引擎最佳化(iThome鐵人賽系列書)$780$608 -
78折
超實用!業務.總管.人資的辦公室 WORD 365 省時高手必備 50招 (第二版)$500$390 -
7折
Node-RED + YOLO + ESP32-CAM:AIoT 智慧物聯網與邊緣 AI 專題實戰$680$476 -
79折
「生成式⇄AI」:52 個零程式互動體驗,打造新世代人工智慧素養$599$473 -
7折
Windows APT Warfare:惡意程式前線戰術指南, 3/e$720$504 -
75折
我輩程式人:回顧從 Ada 到 AI 這條程式路,程式人如何改變世界的歷史與未來展望 (We, Programmers: A Chronicle of Coders from Ada to AI)$850$637 -
75折
不用自己寫!用 GitHub Copilot 搞定 LLM 應用開發$600$450 -
79折
Tensorflow 接班王者:Google JAX 深度學習又快又強大 (好評回饋版)$780$616 -
79折
GPT4 會你也會 - 共融機器人的多模態互動式情感分析 (好評回饋版)$700$553 -
79折
技術士技能檢定 電腦軟體應用丙級術科解題教本|Office 2021$460$363 -
75折
Notion 與 Notion AI 全能實戰手冊:生活、學習與職場的智慧策略 (暢銷回饋版)$560$420
相關主題
商品描述
歡迎來到Python的世界。
本書介紹了Python的語法、數據結構等基礎知識,以及經典的Python爬蟲、網頁文本分析及可視化。
在本書中,讀者不僅可以與Python“結識”,還會遇到新“朋友”———瀏覽器的開發者工具,
通過它來瞭解HTML編寫網頁的語言,並進行結構化的網頁分析和所需數據的提取。
拿來主義特別適合來類比Python語言中的庫,Python將與re、requests、lxml等經典的庫組合在一起,
自動抓取網頁數據的爬蟲。Pandas這個工具會對抓取的數據進行文本分析,
並實現將枯燥的數據進行漂亮的可視化呈現。
千裏之行,始於足下,歡迎進入本書的奇妙之旅。
目錄大綱
目錄
第1章初識Python
1.1使用IDLE
1.2從字符串著手
1.3複雜數據的福音——列表
1.3.1創建列表
1.3.2列表的操作
1.4處理數據——條件判斷
1.5處理數據——循環
1.6處理數據進階——嵌套語句
1.7函數
1.8拿來就用——模塊
1.9文件
1.10處理異常
第2章網頁
2.1工具準備
2.2從URL開始
2.2.1簡單獲取URL
2.2.2鏈接與URL
2.3編寫網頁的語言— —HTML
2.3.1創建自己的第一個網頁
2.3.2標籤——創建網頁的方塊
2.3.3標籤屬性
2.4 CSS與class
2.5 JavaScript和id
2.6網頁分析工具
2.6.1谷歌開發者工具
2.6.2查看網頁結構
2.6.3定位指定的元素
2.6.4篩選不同的資源
2.7網頁的快遞——HTTP
2.7.1 HTTP請求
2.7.2 HTTP響應
2.7.3 HTTP的應用——Cookie和Session
2.7.4實戰——HTTP的交互過程
2.8以URL結束
2.9本章總結
第3章數據抓取
3.1工具準備
3.2 Xpath和lxml.html
3.2.1網頁分析利器——lxml
3.2.2 XPath
3.2.3 XPath使用實例
3.2.4 XPath演示
3.3關於robots.txt
3.4小試牛刀
3.4.1過程分析
3.4.2動手敲代碼
3.4.3小結
3.4.4擴展
3.5獲取電影數據(上)
3.5.1過程分析
3.5.2動手敲代碼
3.5.3小結
3.6獲取電影數據(下)
3.6. 1過程分析
3.6.2動手敲代碼
3.6.3考慮加強代碼的健壯性
3.6.4小結
3.7另類的網頁抓取
3.7.1過程分析
3.7.2動手敲代碼
3.7.3小結
3.8爬蟲與網絡機器人
3.9本章總結
第4章文本處理
4.1正則表達式
4.1.1怎樣進行匹配
4.1.2常用的元字符
4.2更強的文本工具——Python的re庫
4.2.1匹配對象怎麼用
4.2.2使用regex來搜索
4.2.3使用regex來替換
4.2.4更方便查找
4.2.5 re庫中的控制標誌
4.2.6 replace()和re.sub()
4.2.7實現更高級的strip()方法
4.2.8新的拆分方法re.split()
4.2. 9怎樣提取中文
4.3電影數據的處理
4.3.1提取之前的觀察
4.3.2需要獲取哪些數據
4.3.3多樣化的方法
4.3.4格式化的數據
4.4本章總結
第5章數據分析
5.1工具準備
5.1.1配置Jupyter Notebook
5.1.2數據生成幫手——Numpy
5.1.3 Pandas中的數據結構
5.2像一維數組的Series
5.2.1獲取Series信息
5.2.2 Series進行數學運算
5.2.3對Series進行一些操作
5.2.4方法串聯
5.2.5操作Series中的字符串數據
5.2.6小結一下Series
5.3 DataFrame
5.3.1創建DataFrame
5.3.2對齊
5.3.3瞭解DataFrame
5.3 .4常用DataFrame操作
5.3.5數據的導入與導出
5.4簡單數據分析
5.4.1電影評分分佈
5.4.2電影產量趨勢
5.4.3評論人數最多的電影
5.4.4發行電影最多的國家
5.5看得見的數據
5.5.1線圖
5.5.2柱狀圖
5.5.3餅圖
5.6 matplotlib
5.6.1繪圖方法
5.6.2子圖形及佈局
5.6.3圖形大小、顏色和樣式
5.7畫一張圖來結尾
5.8本章總結
