Python 大數據特訓班:資料自動化收集、整理、清洗、儲存、分析與應用實戰, 3/e (附320分鐘影音/範例程式)
鄧文淵 總監製/文淵閣工作室 編著
- 出版商: 碁峰資訊
- 出版日期: 2022-10-26
- 定價: $520
- 售價: 7.9 折 $411
- 語言: 繁體中文
- 頁數: 352
- 裝訂: 平裝
- ISBN: 6263243384
- ISBN-13: 9786263243385
-
相關分類:
大數據 Big-data
立即出貨 (庫存 > 10)
買這商品的人也買了...
-
$520$411 -
$520$410 -
$750$593 -
$620$490 -
$750$593 -
$650$514 -
$680$537 -
$512數據分析原理與實踐 : 基於經典算法及 Python 編程實現
-
$600$468 -
$620$490 -
$600$300 -
$720$569 -
$600$474 -
$454基於 TensorFlow 的圖像生成
-
$720$569 -
$650$507 -
$620$484 -
$500$390 -
$780$663 -
$580$435 -
$560$437 -
$699$552 -
$880$695 -
$780$616 -
$560$442
相關主題
商品描述
Python暢銷經典主題強化再升級
運用世界級熱門開發平台
迅速掌握資料處理要領,深入全方位專案主題
立即體驗Python的大數據超強實戰力
面對大數據資料
如何爬取?如何整理?如何儲存?
如何分析?如何呈現?最後要如何應用?
就從熱門案例切入,快速搜集梳理巨量資訊!
熱門搜尋關鍵字、股票的交易資訊、政府的公開資料、社群網站上傳的圖片與影音,以及實體通路或網路商店的銷售數據…等,都讓資料量快速爆增。大數據時代來臨,不僅科技業重視,就連傳統的零售業、金融業、製造業、旅遊業,以及政府都爭相投入,無不希望能運用數據分析與預測來協助決策方向,掌握數據就能找出趨勢的出路與提高判斷的精準度,也讓新興的數據分析師、資料分析師、資料科學家成為熱門職業。
Python無疑是大數據與AI時代第一程式語言,在數據資料處理的領域中有著非常重要的地位。本書由生活出發,以專題實戰,只要能掌握數據資料爬取清洗、儲存整理、統計分析、視覺化呈現,以及跨領域應用的關鍵技術,就能掌控大數據的應用。
■完整學習Python資料處理的4大觀念與技術:爬取清理、讀取儲存、統計分析、呈現與應用。
■快速熟悉Python熱門開發平台Google Colab,建立資料科學的基本觀念,學會Python語法函數模組的應用,並透過資料分析實作演練,培養數據分析開發領域所需的技能。
■全面深入不同應用面向,如:網路爬蟲、資料正規化、資料視覺化、資料儲存與讀取(CSV、Excel、Google試算表、多媒體檔案擷取…)、批次檔案下載、公開資料應用、API建立…
■以最多元的熱門實例進行大數據專案實作,如:LINE貼圖收集、線上相簿批次下載、YouTube影片、音檔及播放清單下載,股票市場個股分析統計圖、股價資訊即時推播、網路新書排行榜、人力銀行求職資訊分析、超商門市資訊收集、即時網路聲量輿情觀察、網路線上字典,以及Web API開發…
■範例程式另提供Python筆記神器:Jupyter Notebook格式檔案,讓學習與操作更便利。
■針對專案實戰提供影音輔助教學,加速學習效率。
【書附超值學習資源】320分鐘專案實戰影音教學/範例程式檔/「打造自己的疫情指揮中心:新冠肺炎數據分析實戰」教學影片
作者簡介
一個致力於資訊圖書創作二十餘載的工作團隊,擅長用輕鬆詼諧的筆觸,深入淺出介紹難懂的 IT 技術,並以範例帶領讀者學習電腦應用的大小事。
我們不賣弄深奧的專有名辭,奮力堅持吸收新知的態度,誠懇地與讀者分享在學習路上的點點滴滴,讓軟體成為每個人改善生活應用、提昇工作效率的工具。
舉凡程式開發、文書處理、美工動畫、攝影修片、網頁製作,都是我們專注的重點,而不同領域有各自專業的作者組成,以進行書籍的規劃與編寫。一直以來,感謝許多讀者與學校老師的支持,選定為自修用書或授課教材。衷心期待能盡我們的心力,幫助每一位讀者燃燒心中的小宇宙,用學習的成果在自己的領域裡發光發熱!
我們期待自己能在每一本創作中注入快快樂樂的心情來分享, 也期待讀者能在這樣的氛圍下快快樂樂的學習。
官方網站:www.e-happy.com.tw
FB粉絲團:www.facebook.com/ehappytw
目錄大綱
01 Python 雲端開發平台:Colab
1.1 Google Colab:雲端開發平台
1.2 Colab的筆記功能
02 數據資料的爬取
2.1 requests模組:讀取網站檔案
2.2 BeautifulSoup模組:網頁解析
2.3 使用正規表達式
03 數據資料的儲存與讀取
3.1 檔案的讀寫
3.2 csv資料的儲存與讀取
3.3 json資料的儲存與讀取
3.4 Excel資料儲存與讀取
3.5 SQLite資料庫的操作
3.6 Google試算表的操作
04 數據資料視覺化
4.1 繪製折線圖:plot
4.2 長條圖與橫條圖:bar、barh
4.3 圓形圖:pie
4.4 直方圖:hist
4.5 散佈圖:scatter
4.6 設定圖表區:figure
4.7 在圖表區加入多張圖表:subplot、axes
05 Numpy數據運算
5.1 Numpy:高速運算的解決方案
5.2 Numpy陣列建立
5.3 Numpy陣列取值
5.4 Numpy的陣列運算功能
06 Pandas資料處理
6.1 Pandas Series的建立與取值
6.2 Pandas DataFrame的建立
6.3 DataFrame資料取值
6.4 DataFrame資料操作
6.5 Pandas資料存取
6.6 Pandas模組:繪圖應用
6.7 Pandas資料清洗
6.8 Pandas 資料篩選、分組運算
07 LINE貼圖收集器
7.1 專題方向
7.2 關鍵技術
7.3 實戰:LINE貼圖收集器
08 YouTube影片資源下載
8.1 專題方向
8.2 關鍵技術
8.3 實戰:批次下載YouTube影片
09 運動相簿批次爬取
9.1 專題方向
9.2 關鍵技術
9.3 實戰:運動相簿批次爬取
9.4 非同步模組-concurrent.futures
10 台灣股票市場分析統計圖
10.1 專題方向
10.2 關鍵技術
10.3 實戰:個股單月與年度統計圖
11 行動股市即時報價
11.1 專題方向
11.2 關鍵技術
11.3 實戰:用LINE傳送即時股價
12 網路書店新書排行榜
12.1 專題方向
12.2 關鍵技術
12.3 實戰:網路書店新書排行榜
13 人力銀行網站求職小幫手
13.1 專題方向
13.2 關鍵技術
13.3 實戰:1111人力銀行求職小幫手
14 7-11超商門市資料下載
14.1 專題方向
14.2 關鍵技術
14.3 實戰:7-11超商門市資料下載
15 即時網路聲量輿情收集器
15.1 專題方向
15.2 關鍵技術
15.3 實戰:即時網路聲量輿情資料下載
16 線上國語字典
16.1 專題方向
16.2 關鍵技術
16.3 實戰:建立線上國語字典及Web App