大數據分析師面試筆試寶典
猿媛之家組編周炎亮 劉誌全 楚秦等編著
- 出版商: 機械工業
- 出版日期: 2022-09-02
- 定價: $534
- 售價: 8.5 折 $454
- 語言: 簡體中文
- 頁數: 292
- 裝訂: 平裝
- ISBN: 7111712110
- ISBN-13: 9787111712114
-
相關分類:
大數據 Big-data
立即出貨 (庫存 < 4)
買這商品的人也買了...
-
$454Kubernetes 源碼剖析 -
$607Kubernetes 微服務實戰 (Hands-On Microservices with Kubernetes) -
數據庫高效優化 : 架構、規範與 SQL 技巧$594$564 -
$454Knative 實戰:基於 Kubernetes 的無服務器架構實踐 -
Excel 函數庫最完整職場商業應用王者歸來$620$434 -
人工智慧大現場 - 實用篇-35天從入門到完成專案$690$538 -
Power BI 入門 大數據視覺化 + 智慧決策 + 雲端分享 王者歸來 (全彩印刷)$620$490 -
$297CKA/CKAD 應試指南 : 從 Docker 到 Kubernetes 完全攻略 -
OpenCV 影像創意邁向 AI 視覺王者歸來 (全彩印刷)$890$668 -
從 Docker 動手邁入全新 DevOps 時代:最完整 Kubernetes 全書$1,280$1,011 -
$704雲原生 Kubernetes 全棧架構師實戰 -
演算法學習手冊|寫出更有效率的程式 (Learning Algorithms: A Programmer's Guide to Writing Better Code)$580$458 -
深入剖析 Kubernetes$560$442 -
$505自然語言處理的 Python 實踐 -
$403深度學習(R語言版) -
LINE 聊天機器人 + AI + 雲端 + 開源 + 程式:輕鬆入門到完整學習$600$474 -
Object-Oriented Python|以 GUI 和遊戲程式學物件導向程式設計 (Object-Oriented Python)$520$411 -
深入淺出 Android 開發, 3/e (Head First Android Development : A Learner's Guide to Building Android Apps with Kotlin, 3/e)$1,200$948 -
Python 視窗 GUI 設計 活用 tkinter 之路 -- 王者歸來, 4/e$720$569 -
Notion 打造你的高效數位人生 -- 王者歸來$500$395 -
去園區當 ARM 工程師 - 嵌入式 C語言全高度昇華$1,080$853 -
高速建立大型桌面應用 - 全新 Electron 框架現在就動手做$880$695 -
Code That Fits in Your Head|軟體工程的啟發式方法$580$435 -
IT 工程師必需!Linux 快速入門實戰手冊 - 從命令列、系統設定到開發環境建置, 實體機、虛擬機、容器化、WSL、雲端平台全適用$630$498 -
科學方法賺大錢 - Python 進行商品期貨量化交易$720$569
中文年末書展|繁簡參展書2書75折 詳見活動內容 »
-
75折
為你寫的 Vue Components:從原子到系統,一步步用設計思維打造面面俱到的元件實戰力 (iThome 鐵人賽系列書)$780$585 -
75折
BDD in Action, 2/e (中文版)$960$720 -
75折
看不見的戰場:社群、AI 與企業資安危機$750$563 -
79折
AI 精準提問 × 高效應用:DeepSeek、ChatGPT、Claude、Gemini、Copilot 一本搞定$390$308 -
7折
超實用!Word.Excel.PowerPoint 辦公室 Office 365 省時高手必備 50招, 4/e (暢銷回饋版)$420$294 -
75折
裂縫碎光:資安數位生存戰$550$412 -
85折
日本當代最強插畫 2025 : 150位當代最強畫師豪華作品集$640$544 -
79折
Google BI 解決方案:Looker Studio × AI 數據驅動行銷實作,完美整合 Google Analytics 4、Google Ads、ChatGPT、Gemini$630$498 -
79折
超有料 Plus!職場第一實用的 AI 工作術 - 用對 AI 工具、自動化 Agent, 讓生產力全面進化!$599$473 -
75折
從零開始學 Visual C# 2022 程式設計, 4/e (暢銷回饋版)$690$518 -
75折
Windows 11 制霸攻略:圖解 AI 與 Copilot 應用,輕鬆搞懂新手必學的 Windows 技巧$640$480 -
75折
精準駕馭 Word!論文寫作絕非難事 (好評回饋版)$480$360 -
Sam Yang 的插畫藝術:用 Procreate / PS 畫出最強男友視角 x 女孩美好日常$699$629 -
79折
AI 加持!Google Sheets 超級工作流$599$473 -
78折
想要 SSR? 快使用 Nuxt 吧!:Nuxt 讓 Vue.js 更好處理 SEO 搜尋引擎最佳化(iThome鐵人賽系列書)$780$608 -
78折
超實用!業務.總管.人資的辦公室 WORD 365 省時高手必備 50招 (第二版)$500$390 -
7折
Node-RED + YOLO + ESP32-CAM:AIoT 智慧物聯網與邊緣 AI 專題實戰$680$476 -
79折
「生成式⇄AI」:52 個零程式互動體驗,打造新世代人工智慧素養$599$473 -
7折
Windows APT Warfare:惡意程式前線戰術指南, 3/e$720$504 -
75折
我輩程式人:回顧從 Ada 到 AI 這條程式路,程式人如何改變世界的歷史與未來展望 (We, Programmers: A Chronicle of Coders from Ada to AI)$850$637 -
75折
不用自己寫!用 GitHub Copilot 搞定 LLM 應用開發$600$450 -
79折
Tensorflow 接班王者:Google JAX 深度學習又快又強大 (好評回饋版)$780$616 -
79折
GPT4 會你也會 - 共融機器人的多模態互動式情感分析 (好評回饋版)$700$553 -
79折
技術士技能檢定 電腦軟體應用丙級術科解題教本|Office 2021$460$363 -
75折
Notion 與 Notion AI 全能實戰手冊:生活、學習與職場的智慧策略 (暢銷回饋版)$560$420
相關主題
商品描述
《大數據分析師面試筆試寶典》旨在幫助讀者瞭解大數據分析師的工作內容、
技能要求、各類常用技術的原理和可能應用的場景。
大數據分析是一個多學科交叉的領域,包含了統計學、計算機科學、運籌學乃至市場營銷學等。
《大數據分析師面試筆試寶典》並沒有介紹大數據分析領域涉及的所有方面,
而是根據當前用人單位對大數據分析師的需求,
選擇了其中較為重要的內容進行解析,將當前大數據分析涉及的熱點技術一網打盡。
閱讀《大數據分析師面試筆試寶典》需要具備一定的數理統計知識基礎和計算機編程背景。
本書盡量不去證明一些在理論界已有的結論,而是用淺顯的語言來解釋複雜的公式,
以便讀者更為輕鬆地掌握全書的知識,從而能夠從容面對面試以及日常工作。
作者簡介
周炎亮
全棧數據分析師,北京化工大學工程管理碩士。
擁有10多年的數據分析經驗,擅長將各種業務問題轉化為可量化的數學模型。
先後在諮詢公司、因特網公司擔任數據分析師,
現在某工業因特網公司擔任高級數據分析經理,致力於解決工業領域的數據分析問題。
劉誌全
博士,暨南大學網絡空間安全學院副研究員、碩士生導師;
近年來共在IEEE TITS、IEEE TDSC、IEEE IOTJ、IEEE TVT等國內外權威期刊/會議發表SCI/EI論文40餘篇,
申請/授權/公告國家發明專利/國外發明專利/PCT專利40餘項。
目錄大綱
第1章面試經驗/1
1.1 大數據分析技能要求/1
1.1.1 數據分析師/1
1.1.2 數據開發工程師/4
1.1.3 數據挖掘工程師/7
1.1.4 職業能力模型/10
1.2 數據分析工作流程/10
1.2.1 組織架構/10
1.2.2 分析流程/11
1.3 數據分析師臨場面試/13
1.3.1 如何準備面試/13
1.3.2 面試問題/16
1.4 本章總結/18
第2章統計學知識/19
2.1 概率知識/19
2.1.1 概率模型之間的關係解析/19
2.1.2 概率相關面試題/25
2.1.3 貝葉斯公式/28
2.2 參數估計/31
2.2.1 點估計/31
2.2.2 區間估計/34
2.3 假設檢驗/41
2.3.1 假設檢驗原理/41
2.3.2 兩類錯誤/43
2.3.3 假設檢驗的常用方法/45
2.4 抽樣技術解析/49
2.4.1 樣本量影響因素分析/50
2.4.2 假設檢驗樣本量計算/52
2.4.3 參數估計樣本量計算/53
2.5 馬爾可夫模型/54
2.5.1 馬爾可夫過程原理/55
2.5.2 馬爾可夫模型計算/55
2.6 隱馬爾可夫模型/57
2.6.1 HMM和三類問題/57
2.6.2 求概率問題/58
2.6.3 預測問題/59
2.6.4 學習問題/60
2.7 EM算法/62
2.7.1 基本思想/62
2.7.2 算法流程/63
2.8 本章總結/63
第3章數據挖掘算法/65
3.1 常用聚類算法/66
3.1.1 Kmeans算法/66
3.1.2 DBSCAN算法/68
3.1.3 聚類算法評估/69
3.2 常用分類算法/74
3.2.1 決策樹/74
3.2.2 樸素貝葉斯/79
3.2.3 KNN/80
3.2.4 SVM/81
3.2.5 邏輯回歸/84
3.2.6 BP神經網絡/88
3.3 集成學習算法/91
3.3.1 Bagging原理/92
3.3.2 隨機森林/93
3.3.3 Boosting原理/95
3.3.4 Adaboost算法/96
3.3.5 Stacking算法/99
3.3.6 分類算法評估/100
3.3.7 分類算法小結/108
3.4 關聯規則算法/108
3.4.1 Apriori/108
3.4.2 Fp_Growth/111
3.4.3 算法評估/112
3.5 數據降維算法/112
3.5.1 降維技術基本理論/112
3.5.2 特徵選擇/113
3.5.3 主成分分析/116
3.5.4 SVD分解/118
3.5.5 降維方法選擇/121
3.6 數據升維方法/121
3.6.1 分箱/121
3.6.2 交互式特徵/123
3.7 推薦算法/124
3.7.1 基於內容推薦/124
3.7.2 基於用戶的協同過濾/125
3.7.3 基於物品的協同過濾/126
3.7.4 SVD推薦原理/127
3.7.5 推薦算法評估/130
3.8 模型優化方法/130
3.8.1 機器學習抽樣/130
3.8.2 相似性度量/134
3.8.3 損失函數/136
3.8.4 過擬合與欠擬合/138
3.8.5 正則化方法/139
3.8.6 剪枝方法/141
3.8.7 模型選擇/144
3.9 本章總結/145
第4章大數據技術解析/147
4.1 數據埋點技術/148
4.1.1 技術原理/148
4.1.2 代碼埋點/149
4.1.3 可視化埋點/149
4.1.4 無埋點技術/150
4.1.5 埋點需求分析/150
4.1.6 選擇部署方式/151
4.2 網絡爬蟲技術/152
4.2.1 聚焦爬蟲工作流程/153
4.2.2 數據解析流程/154
4.2.3 爬行策略/154
4.2.4 網頁更新策略/155
4.3 數據倉庫技術/156
4.3.1 數倉名詞解析/156
4.3.2 數據建模方法/161
4.3.3 數倉建設原則/164
4.3.4 SQL查詢/166
4.3.5 SQL查詢優化/170
4.4 ETL技術/171
4.4.1 數據質量評估/172
4.4.2 ETL流程/173
4.4.3 缺失值處理方法/177
4.4.4 異常值識別方法/179
4.5 Hadoop技術/180
4.5.1 Hadoop核心之HDFS/181
4.5.2 Hadoop核心之MapReduce/184
4.5.3 YARN/190
4.5.4 WordCount源碼/192
4.5.5 MapReduce優化/194
4.6 Spark技術/196
4.6.1 Spark集群運行/196
4.6.2 Spark程序運行/199
4.6.3 Spark RDD/202
4.6.4 Spark存儲/210
4.6.5 Spark 內存管理/216
4.6.6 Spark資源分配/222
4.6.7 Spark Shuffle機制/224
4.6.8 Spark的算子調優/230
4.6.9 數據傾斜問題解析/231
4.7 本章總結/235
第5章數據可視化/237
5.1 圖表類型/237
5.2 繪圖原則/243
5.3 ECharts快速上手/247
5.3.1 ECharts引入/247
5.3.2 準備DOM容器/248
5.3.3 柱狀圖示例/249
5.4 本章總結/249
附錄/250
附錄A 筆面試真題/250
