商務智能:數據分析的管理視角(原書第5版)

Ramesh Sharda

相關主題

商品描述

本書從管理的角度出發,不拘泥於覆雜的算法和技術細節,旨在幫助初步接觸商務智能的讀者厘清商務智能與人工智能(AI)、雲計算、物聯網、大數據、機器學習和數據科學等眾多概念的區別和聯系,並通過大量的實際案例體會商務智能的功能和價值。本書主要討論商務分析、數據科學和用於企業決策支持的AI,包括相關概念、技術和應用案例等。全書圍繞三種主要的商務分析(描述性分析、預測性分析和規範性分析)組織內容,以反映商務分析的重點。本書可作為高等院校數據科學、數據分析等相關課程的教材,也適合企業管理者、市場分析師和數據科學家等讀者閱讀。

作者簡介

Ramesh Sharda(威斯康星大學麥迪遜分校工商管理碩士、博士),俄克拉何馬州立大學(OSU)斯皮爾斯商學院負責研究和研究生課程的副院長,沃森/康菲石油公司講席教授,管理科學與信息系統專業校董教授。他參與創立並指導了俄克拉何馬州立大學面向高管的商學博士課程。他發表的研究論文多達200余篇,主要刊物包括《運籌學》《管理科學》《信息系統研究》《決策支持系統》和《管理信息系統雜誌》等。他參與創立了信息系統協會(AIS)關於決策支持系統和知識管理的專業興趣小組(SIGDSA)。Sharda博士擔任多個編輯委員會委員,包括《決策科學雜誌》《決策支持系統》和《ACM數據庫》。他撰寫和編輯了多本教科書和專著,並擔任Springer多套叢書的聯合主編。2013年至2020年,他擔任Teradata大學網絡執行總監。他目前的研究興趣是決策支持系統、商務分析和管理信息超載技術。Ramesh是INFORMS和AIS會士,2015年入選俄克拉何馬州高等教育名人堂。2023年春季,他被授予富布賴特-阿爾托大學傑出講席教授。 Dursun Delen(俄克拉何馬州立大學博士),俄克拉何馬州立大學斯皮爾斯商學院商務管理講席教授(斯皮爾斯捐贈),商務分析講席教授(帕特森基金會捐贈),衛生系統創新中心研究主任,管理科學與信息系統專業校董教授。在開始學術生涯之前,他曾在得克薩斯科利奇站的一家私營研究和咨詢公司Knowledge Based Systems擔任了5年研究科學家。在此期間,他領導了許多決策支持項目和其他由幾個聯邦機構資助的與信息系統相關的研究項目,包括美國 (DoD)、美國 航空航天局(NASA)、美國 標準與技術研究所(NIST)、彈道導彈防禦組織(BMDO)和能源部(DoE)。Delen博士發表了200多篇同行評審文章,其中一些文章發表在《決策科學雜誌》《決策支持系統》《ACM通訊》《計算機與運籌學》《工業計算機》《生產運營管理雜誌》《醫學人工智能》《 醫學信息學雜誌》《專家系統與應用》以及《IEEE無線通信》上。他 近撰寫/合著了12本書籍,內容涉及商務分析、數據挖掘、文本挖掘、商務智能和決策支持系統等領域。他經常應邀參加 和 會議,就數據/文本挖掘、商務分析、決策支持系統、商務智能和知識管理等主題發表演講。他曾擔任第四屆網絡計算和 信息管理 會議(2008年9月2日至2008年9月4日,韓國首爾)的大會共同 ,並定期在各種信息系統和分析會議上擔任 、分論壇 或迷你論壇 。他目前擔任《商業分析期刊》和《商業中的人工智能期刊》的主編,以及其他十幾種學術期刊的 編輯、副主編或編委會成員。他的研究和教學方向是數據和文本挖掘、商務分析、決策支持系統、數據科學、知識管理、商務智能和企業 建模。 Efraim Turban(加州大學伯克利分校工商管理碩士、博士),夏威夷大學太平洋信息系統管理研究所訪問學者。在此之前,他曾在多所大學任職,包括香港城市大學、理海大學、佛羅裏達 大學、加利福尼亞州立大學長灘分校、東伊利諾伊大學和南加州大學。Turban博士在《管理科學》《管理信息系統季刊》和《決策支持系統》等主流期刊上發表了100多篇論文。他還著有20本書,包括Electronic Commerce: A Managerial Perspective和Information Technology for Management。他還是 各大公司的顧問。Turban博士目前感興趣的領域是基於網絡的決策支持系統、社交商務和協同決策。

目錄大綱

譯者序
前言
致謝
作者簡介
第1章 商務智能、分析、數據
科學與AI概述 1
1.1 開篇小插曲:運動分析—學習
和理解分析應用領域令人興奮的前沿 2
1.2 不斷變化的商業環境和不斷發展的決策支持和分析需求 15
決策過程 16
數據分析和決策支持技術 16
1.3 決策過程與計算機化決策支持
框架 18
Simon過程:情報、設計與
選擇 18
情報活動階段:問題(或機會)
識別 19
設計階段 21
選擇階段 21
實施階段 21
1.4 計算機決策支持向分析/數據
科學的發展歷程 22
1.5 商務智能框架 25
BI的定義 25
BI發展簡史 25
BI的體系結構 26
BI的起源和驅動因素 26
商務智能多媒體練習 27
事務處理與分析處理 27
適當規劃並與企業戰略保持
一致 28
可實現的實時、按需BI 29
開發或獲取BI系統 29
合理性和成本效益分析 29
安全及隱私保護 30
系統與應用集成 30
1.6 分析概述 30
描述性分析 31
預測性分析 32
規範性分析 37
分析/數據科學/機器學習/AI 38
1.7 部分領域分析實例 39
醫療保健業分析應用—
Humana 39
零售價值鏈分析 41
博彩行業分析應用 43
1.8 本書安排 46
1.9 可用資源和Teradata大學學術
鏈接 47
可用資源和鏈接 47
供應商、產品和 軟件 47
期刊 47
Teradata大學學術鏈接 47
第2章 人工智能:概念、驅動
因素、主要技術及其
商業應用 50
2.1 開篇小插曲:Grant Thornton
雇用Aisera聊天機器人減輕IT
服務臺負擔 51
2.2 人工智能簡介 52
人工智能的定義 52
AI機器的主要特征 53
AI的主要要素 53
AI應用 54
AI的主要目標 54
AI的驅動因素 54
AI的優勢 55
AI機器的一些局限 56
AI決策的三種風格 57
2.3 人機智能 58
什麼是智能 58
AI有多智能 59
測試AI 59
2.4 主要的AI技術及其衍生產品 60
2.5 AI對決策的支持 65
2.6 AI在各種業務功能中的應用 68
AI在會計中的應用 68
AI在金融服務中的應用 69
AI在人力資源管理中的應用 71
AI在市場營銷、廣告和CRM領域
中的應用 72
AI在生產經營管理中的應用 72
2.7 機器人簡介 74
2.8 機器人應用簡介 78
自動駕駛汽車:跑起來的機器人 85
2.9 對話式AI—聊天機器人 87
什麼是聊天機器人 87
聊天機器人的發展 88
聊天機器人的組成部分及其使用過程 88
使用聊天機器人的驅動因素和
好處 89
代表性聊天機器人 90
2.10 企業聊天機器人 90
企業對聊天機器人的興趣 91
企業聊天機器人:營銷和客戶
體驗 91
可口可樂 91
企業聊天機器人:金融服務 92
企業聊天機器人:服務行業 93
聊天機器人平臺 93
企業聊天機器人知識 94
虛擬個人助理 94
如果你是Facebook首席執行官
馬克·紮克伯格 94
的Alexa和Echo 94
蘋果公司的Siri 95
Google Assistant 95
其他個人助理 96
聊天機器人作為專業顧問 96
Robo金融顧問 96
金融機器人顧問的發展 96
第3章 描述性分析:數據的本質、
大數據與統計建模 104
3.1 開篇小插曲:SiriusXM通過數據
驅動式營銷吸引新一代無線電
消費者 105
3.2 用於分析的數據的性質 108
3.3 數據的簡單分類 111
3.4 數據預處理的藝術與科學 113
3.5 大數據的定義 121
定義大數據的“V” 122
3.6 大數據分析基礎 125
大數據分析解決的業務問題 127
3.7 大數據技術 128
Hadoop 128
Hadoop如何工作 128
MapReduce 129
為什麼使用MapReduce 130
Hadoop技術組件 130
Hadoop的利與弊 131
Spark與Hadoop 133
NoSQL 135
數據有益 135
3.8 大數據與流分析 136
流分析應用 138
電子商務 138
電信 138
執法與網絡安全 138
電力工業 138
金融服務 139
健康科學 139
政府 139
3.9 商務分析統計建模 140
用於描述性分析的描述性統計 140
集中趨勢度量 141
算術平均值 141
中位數 142
眾數 142
離散程度度量 142
範圍 142
方差 143
標準差 143
平均 偏差 143
四分位數和四分位數間距 143
箱線圖 144
分布形狀 145
3.10 推斷性統計回歸建模 150
如何開發線性回歸模型 151
如何知道模型是否足夠好 152
線性回歸中 重要的假設是
什麼 153
邏輯回歸 154
時間序列預測 159
第4章 描述性分析:商務智能、
數據倉庫和可視化 166
4.1 開篇小插曲:通過數據倉庫和
商務分析鎖定稅務欺詐 166
4.2 商務智能與數據倉庫 169
什麼是數據倉庫 170
數據倉庫的歷史視角 170
數據倉庫的特征 174
數據集市 174
操作數據存儲 175
企業數據倉庫 175
元數據 175
4.3 數據倉庫過程 176
4.4 數據倉庫架構 177
可選數據倉庫架構 179
哪種架構  181
4.5 數據管理和數據倉庫開發 183
數據倉庫開發方法 184
其他數據倉庫開發註意事項 186
數據倉庫中數據的表示 187
數據倉庫中的數據分析 188
OLAP和OLTP 188
OLAP操作 188
數據集成與提取、轉換和加載
過程 189
數據集成 190
提取、轉換和加載 193
4.6 數據倉庫管理、安全問題和未來趨勢 195
數據倉庫的未來 196
4.7 業務報表 201
4.8 數據可視化 203
數據可視化簡史 203
4.9 不同類型的圖表 205
基本圖表 205
專用圖表 206
應該使用哪種圖表 207
4.10 可視化分析的興起 208
可視化分析 210
高性能可視化分析環境 212
4.11 信息儀表盤 214
儀表盤設計 216
儀表盤中要查找的內容 217
儀表盤設計 實踐 217
以行業標準為基準制定關鍵
性能指標 217
使用情境元數據包裝儀表盤
指標 217
由可用性專家對儀表盤設計
進行驗證 218
對傳輸到儀表盤的報警或異常
進行優先級排序 218
以業務用戶的評論豐富
儀表盤 218
從三個不同層級呈現信息 218
使用儀表盤設計原則選擇正確的
可視化結構 218
提供指導性分析 218
第5章 預測性分析:數據挖掘
過程、方法和算法 226
5.1 開篇小插曲:警察部門利用預測
分析來預測和打擊犯罪 226
5.2 數據挖掘概念與應用 230
定義、特征和優勢 231
數據挖掘原理 232
數據挖掘與統計學 235
5.3 數據挖掘應用 236
5.4 數據挖掘過程 238
步驟1?:業務理解 238
步驟2?:數據理解 239
步驟3?:數據準備 239
步驟4?:建模 239
步驟5?:測試和評估 242
步驟6?:部署 242
其他數據挖掘標準化過程和
方法 243
5.5 數據挖掘方法 245
分類 245
估計分類模型的準確度 246
數據挖掘聚類分析 252
關聯規則挖掘 254
5.6 數據挖掘軟件工具 257
5.7 數據挖掘的隱私問題、謬誤和
隱患 262
數據挖掘的誤區 264
第6章 預測性分析:文本、Web以及社交媒體分析 273
6.1 開篇小插曲:Jeopardy!上的
人機大戰:Watson的故事 273
6.2 文本分析與文本挖掘概述 276
6.3 自然語言處理 279
6.4 文本挖掘應用 284
市場營銷應用 284
安全應用 284
生物醫學應用 287
學術應用 287
6.5 文本挖掘過程 288
任務1?:建立語料庫 290
任務2?:創建詞項-文檔矩陣 290
任務3?:提取知識 291
6.6 情感分析與主題建模 296
情感分析 296
情感分析應用 300
情感分析過程 302
極性識別方法 303
使用詞典 304
使用訓練文檔集 305
識別句子和短語的語義傾向 306
識別文檔的語義傾向 306
主題建模 306
隱含狄利克雷分配 307
6.7 Web挖掘概述 308
Web內容挖掘和Web結構
挖掘 311
6.8 搜索引擎 312
搜索引擎剖析 313
搜索引擎優化 315
搜索引擎優化方法 317
6.9 Web使用挖掘 318
Web分析技術 318
Web分析指標 319
網站可用性 319
流量來源 320
訪客特征 321
轉化統計 321
6.10 社分析 323
社交網絡分析 323
社交網絡分析指標 324
聯系 324
分布 324
分割 325
社交媒體分析 325
人們如何使用社交媒體 326
度量社交媒體的影響 328
社交媒體分析的 實踐 329
第7章 深度學習與認知計算 337
7.1 開篇小插曲:利用深度學習和
人工神經網絡處理欺詐 338
7.2 深度學習簡介 341
7.3 淺層神經網絡概述 344
7.4 開發神經網絡系統的過程 351
人工神經網絡中的學習過程 352
用於神經網絡訓練的反向傳播
算法 353
7.5 照亮人工神經網絡的黑箱 355
7.6 深度神經網絡 362
前饋多層感知機深度網絡 362
隨機權重在深度MLP中的
影響 363
多的隱藏層與 多的神經元 364
7.7 卷積神經網絡 367
卷積函數 368
池化 370
使用卷積網絡進行圖像處理 371
使用卷積網絡處理文本 374
7.8 遞歸網絡和長短期記憶網絡 377
LSTM網絡的應用 379
ChatGPT 381
7.9 實施深度學習的計算機架構 385
Torch 386
Caffe 386
TensorFlow 387
Theano 387
Keras?:一個應用程序編程
接口 387
7.10 認知計算 390
認知計算如何工作 390
認知計算與AI有何不同 392
認知搜索 393
認知計算實例:IBM Watson 395
第8章 規範性分析:優化和
模擬 408
8.1 開篇小插曲:平衡配送路線、
生產計劃和庫存 409
8.2 基於模型的決策 410
規範性分析模型示例 412
問題識別與環境分析 413
模型類別 415
8.3 用於決策支持的數學模型的
結構 416
決策支持數學模型的組成部分 416
數學模型的結構 417
8.4 確定性、不確定性與風險分析 418
確定性決策 418
不確定性決策 418
風險下的決策(風險分析) 419
8.5 使用電子表格進行決策建模 419
8.6 數學規劃優化 423
線性規劃模型 425
線性規劃中的建模:一個例子 426
實現 431
8.7 多目標、敏感性分析、假設
分析和目標搜索 432
多目標 433
敏感性分析 433
假設分析 434
目標搜索 435
8.8 基於決策表和決策樹的決策
分析 436
決策表 436
決策樹 438
8.9 模擬概論 438
模擬的主要特征 440
模擬的優點 440
模擬的缺點 441
模擬方法 441
模擬類型 442
蒙特卡羅模擬 443
離散事件模擬 443
常規模擬的不足 444
視覺交互模擬 444
視覺交互式模擬與決策支持
系統 444
模擬軟件 445
8.10 遺傳算法及其開發應用 445
遺傳算 語 447
遺傳算法的工作原理 448
遺傳算法的應用 450
第9章 商務分析工具的前景 460
9.1 開篇小插曲:希捷如何應用
KNIME應對數字化轉型 460
9.2 分析工具的重要性 463
分析工具的多維分類 464
分析工具的流行程度 466
9.3 免費開源的分析程序語言 470
R語言 470
如何開始使用R 470
R分析及應用教程—預測
員工流失 472
數據可視化 474
機器學習用於預測建模 476
可解釋性AI 478
Rattle 480
Python語言 481
如何開始使用Python 481
Python分析及應用教程—預測
電影票房成績 482
9.4 免費和開源分析可視化工具 488
KNIME 488
KNIME應用教程:預測客戶
流失 495
Orange 499
Orange應用教程:已出版文獻的
文本挖掘 499
Weka 505
RapidMiner 506
RapidMiner應用教程:使用Titanic數據集預測乘客的生存情況 506
9.5 商務分析工具 510
Alteryx 510
IBM 511
SAS 511
JMP 513
JMP Pro應用教程:已出版文獻的
文本挖掘 513
JMP Pro與Orange的比較 518
Teradata 519
分析引擎和功能 519
TIBCO 523
其他分析工具 523
0章 分析與數據科學中的
AI趨勢 528
10.1 開篇小插曲:Discover Foods
探索利用物聯網和機器學習來
確保食品質量 528
10.2 基於雲的分析 531
數據即服務 533
桌面即服務 533
軟件即服務 534
平臺即服務 534
基礎設施即服務 534
雲計算基本技術 534
雲部署模型 537
App開發和部署中的主要雲
平臺提供商 538
分析即服務 539
代表性分析即服務產品 539
使用雲基礎設施的圖解分析
應用 541
10.3 定位分析 542
地理空間分析 543
利用地理空間分析的多媒體
分析練習 546
實時智能定位 547
面向消費者的分析應用 548
10.4 圖像分析/另類數據 549
10.5 物聯網基礎 552
定義和特征 552
物聯網生態系統 553
物聯網系統結構 554
物聯網的主要優勢和驅動
因素 556
物聯網的工作原理 557
物聯網與決策支持 558
傳感器及其在物聯網中的
作用 558
傳感器技術簡介 558
傳感器如何與物聯網協同
工作 558
傳感器應用與射頻識別
傳感器 559
RFID和智能傳感器在物聯網
中的應用 560
10.6 物聯網應用 561
智能家居和家電 562
智能家居的典型組件 562
智能家電 563
智能家居是機器人的天下 564
智能家居應用存在的障礙 564
智慧城市和智能工廠中的智能
組件 564
改善智慧城市的交通 565
自動駕駛汽車 565
自動駕駛汽車的實施問題 566
物聯網的未來 566
10.7 5G技術及其對AI的影響 567
10.8 其他新興AI主題:機器人過程
自動化 569
10.9 生物信息學與健康網絡科學 570
10.10 其他 進展 574
Web 3.0 574
元宇宙與數字孿生 575
GPT-3/ChatGPT 576
LaMDA 576
Blenderbot 577
1章 商務分析中的道德、
隱私和管理思考 583
11.1 開篇小插曲:從組織的分析歷程
中汲取的經驗教訓 583
11.2 實現智能系統:概述 586
智能系統的實施過程 587
11.3 智能系統的成功部署 588
管理層和實施 588
系統開發實施問題 589
連接和集成 589
安全保護 589
在業務中利用智能系統 590
智能系統應用 590
11.4 物聯網實施及管理思考 590
實施存在的主要問題 591
將工業物聯網轉化為競爭優勢的戰略 592
11.5 合法性、隱私和道德問題 593
法律問題 594
AI潛在法律問題示例 594
隱私問題 595
誰擁有我們的私有數據 597
道德問題 598
智能系統的道德問題 598
智能系統倫理的其他主題 599
11.6 道德/責任/可信賴AI 600
O’Neil關於潛在分析風險的
主張 604
11.7 智能系統對組織的影響 605
新的組織單位及其管理 605
轉變業務,增強競爭優勢 605
通過使用分析重新設計組織 607
智能系統對管理者活動、績效和
工作滿意度的影響 608
對決策的影響 609
產業結構調整 609
11.8 智能系統對就業和工作的
影響 610
概述 610
智能系統會搶走我的工作嗎 611
AI使許多工作岌岌可危 611
哪些職業 危險?哪些職業是
安全的? 613
多失業觀察 613
智能系統實際上可能會增加
就業機會 614
就業和工作性質將發生變化 614
結束語:我們要樂觀一點! 615
11.9 AI的潛在危險 616
AI反烏托邦的立場 616
AI烏托邦的立場 616
11.10 公民科學與公民數據
科學家 617
公民科學 617
公民數據科學家 618
結束語 619
術語表 625
·全面升級,突出重點,添加4章新內容,並且包含關於ChatGPT、元宇宙、可解釋AI和認知計算等新興技術的討論。 ·采用EEE(曝光、體驗、探索)方法,鼓勵讀者通過軟件工具來體驗各類技術,並不斷挖掘新技術和新應用。 ·不僅介紹設計和開發商務智能系統的原理和方法,而且涵蓋豐富的實例,如運動學分析、電影票房預測、謊言挖掘、交通擁堵檢測等。