Python 統計分析 (An Introduction to Statistics with Python: With Applications in the Life Sciences)

[奧地利]托馬斯·哈斯爾萬特

買這商品的人也買了...

商品描述

本書以基礎的統計學知識和假設檢驗為重點,簡明扼要地講述了Python在數據分析、可視化和統計建模中的應用。主要包括Python的簡單介紹、研究設計、數據管理、概率分佈、不同數據類型的假設檢驗、廣義線性模型、生存分析和貝葉斯統計學等從入門到高級的內容。

本書利用Python這門開源語言,不僅在直觀上對數據分析和統計檢驗提供了很好的理解,而且在相關數學公式的講解上也能夠做到深入淺出。本書的可操作性很強,配套提供相關的代碼和數據,讀者可以依照書中所講,復現和加深對相關知識的理解。

本書適合對統計學和Python有興趣的讀者,特別是在實驗學科中需要利用Python的強大功能來進行數據處理和統計分析的學生和研究人員。

作者簡介

作者:[奧地利]托馬斯·哈斯爾萬特(Thomas Haslwanter)譯者:李銳
作者簡介
托馬斯·哈斯爾萬特(Thomas Haslwanter)在學術機構中有超過10年的教學經驗,是林茨上奧地利州應用科學大學(University of Applied Sciences Upper Austria in Linz)醫學工程系的教授,瑞士蘇黎世聯邦理工學院講師,並曾在澳大利亞悉尼大學和德國圖賓根大學擔任過研究員。他在醫學研究方面經驗豐富,專注於眩暈症的診斷、治療和康復。在深入使用Matlab十五年後,他發現Python非常強大,並將其用於統計數據分析、聲音和圖像處理以及生物仿真應用。

譯者簡介
李銳,復旦大學公共衛生學院流行病與生物統計專業博士生,Python、R和Lisp語言的愛好者,主要研究方向為統計學習和機器學習建模以及組學數據的數據挖掘。先後以第一作者身份發表學術論文6篇,其中SCI論文4篇。參編中文專著2本。

審校者簡介
張志傑,復旦大學公共衛生學院副教授,多本國際醫療衛生期刊的特邀編輯,研究方向為統計建模和醫學領域的統計分析方法。參與並完成國家重大科技專項、“863”、國家“十五”科技攻關課題、自然科學基金重大項目等多項國家級課題的研究,研究成果先後獲2010年全國百篇優秀博士學位論文、2012年上海市醫學獎二等獎、上海市科技進步獎二等獎以及中華醫學獎三等獎,2011年入選復旦大學首批“卓學人才計劃”,2013年入選上海市第二批新優青人才計劃。

目錄大綱

第一部分Python和統計學
第1章為什麼學習統計學2 
第2章Python 4 
2.1開始4 
2.1.1慣例4 
2.1.2發行版和包5 
2.1.3安裝Python 7 
2.1.4安裝R和rpy2 8 
2.1 .5個性化IPython/Jupyter 9 
2.1.6 Python資源12 
2.1.7第一個Python程序13 
2.2 Python數據結構14 
2.2.1 Python數據類型14 
2.2.2索引和切片16 
2.2.3向量和數組17 
2.3 IPython/Jupyter:一個交互式的Python編程環境18 
2.3.1 Qt控制台的第一個會話19 
2.3.2 Notebook和rpy2 21 
2.3.3 IPython小貼士23 
2.4開發Python程序24 
2.4.1將交互式命令轉化為一個Python程序24 
2.4.2函數、模塊和包26 
2.4.3 Python小貼士30 
2.4.4代碼版本控制31 
2.5 Pandas:用於統計學的數據結構31 
2.5.1數據處理31
2.5.2分組(Grouping) 33 
2.6 Statsmodels:統計建模的工具34 
2.7 Seaborn:數據可視化35 
2.8一般慣例36 
2.9練習36 
第3章數據輸入38 
3.1從文本文件中輸入38 
3.1.1目視檢查38 
3.1.2讀入ASCII數據到Python中38 
3.2從MS Excel中導入42 
3.3從其他格式導入數據43 
第4章統計數據的展示45 
4.1數據類型45 
4.1.1分類數據45 
4.1.2數值型46 
4.2在Python中作圖46 
4.2.1函數式和麵向對象式的繪圖方法47 
4.2.2交互式繪圖48 
4.3展示統計學數據集52 
4.3.1單變量數據53 
4.3.2二元變量和多元變量繪圖59 
4.4練習61 
第二部分分佈和假設檢驗
第5章背景63 
5.1總體和样本63 
5.2概率分佈64 
5.2.1離散分佈64 
5.2.2連續分佈65 
5.2.3期望值和方差65 
5.3自由度66 
5.4研究設計66
5.4.1術語67 
5.4.2概述67 
5.4.3研究類型68 
5.4.4實驗設計69 
5.4.5個人建議72 
5.4.6臨床研究計劃73 
第6章單變量的分佈74 
6.1分佈的特徵描述74 
6.1 .1分佈中心74 
6.1.2量化變異度76 
6.1.3分佈形狀的參數描述79 
6.1.4概率密度的重要展示81 
6.2離散分佈82 
6.2.1伯努利分佈82 
6.2.2二項分佈83 
6.2 .3泊松分佈85 
6.3正態分佈86 
6.3.1正態分佈的例子88 
6.3.2中心極限定理88 
6.3.3分佈和假設檢驗89 
6.4來自正態分佈的連續型分佈90 
6.4.1 t分佈90 
6.4.2卡方分佈92 
6.4.3 F分佈94 
6.5其他連續型分佈95 
6.5.1對數正態分佈96 
6.5.2韋伯分佈96 
6.5.3指數分佈97 
6.5.4均勻分佈98 
6.6練習98 
第7章假設檢驗100 
7.1典型分析步驟100
7.1.1數據篩选和離群值100 
7.1.2正態性檢驗101 
7.1.3轉換104 
7.2假設概念、錯誤、p值和样本量104 
7.2.1一個例子104 
7.2.2推廣和應用105 
7.2. 3 p值的解釋106 
7.2.4錯誤的類型107 
7.2.5樣本量108 
7.3靈敏度和特異度110 
7.4受試者操作特徵(ROC)曲線113 
第8章數值型數據的均值檢驗114 
8.1樣本均值的分佈114 
8.1.1單樣本均值的t檢驗114 
8.1.2 Wilcoxon符號秩和檢驗116 
8.2兩組之間的比較117 
8.2.1配對t檢驗117 
8.2.2獨立組別之間的t檢驗118 
8.2. 3兩組之間的非參數比較:Mann-Whitney檢驗118 
8.2.4統計學假設檢驗與統計學建模118 
8.3多組比較120 
8.3.1方差分析(ANOVA) 120 
8.3.2多重比較123 
8.3. 3 Kruskal–Wallis檢驗125 
8.3.4兩因素方差分析126 
8.3.5三因素方差分析126 
8.4總結:選擇正確的檢驗方法進行組間比較127
8.4.1典型的檢驗127 
8.4.2假設的例子128 
8.5練習129 
第9章分類數據的檢驗131 
9.1單個率131 
9.1.1置信區間131 
9.1.2解釋132 
9.1.3例子132 
9.2頻數表133 
9.2 .1單因素卡方檢驗133 
9.2.2卡方列聯表檢驗134 
9.2.3 Fisher精確檢驗136 
9.2.4 McNemar檢驗139 
9.2.5 Cochran's Q檢驗140 
9.3練習141 
第10章生存時間分析144 
10.1生存分佈144 
10.2生存概率145 
10.2.1刪失145 
10.2.2 Kaplan–Meier生存曲線146 
10.3在兩組間比較生存曲線148 
第三部分統計建模
第11章線性回歸模型150 
11.1線性相關150 
11.1.1相關係數150 
11.1.2秩相關151 
11.2一般線性回歸模型152 
11.2.1例子1:簡單線性回歸153 
11.2.2例子2:二次方擬合153 
11.2.3決定係數154
11.3 Patsy:公式的語言155 
11.4用Python進行線性回歸分析158 
11.4.1例子1:擬合帶置信區間的直線158 
11.4.2例子2:嘈雜的二次多項式159 
11.5線性回歸模型的結果162 
11.5. 1例子:英國的煙草和酒精162 
11.5.2帶有截距的回歸的定義165 
11.5.3 R2值165 
11.5.4調整後的R2值165 
11.5.5模型的係數和它們的解釋168 
11.5.6殘差分析171 
11.5.7異常值174 
11.5.8用Sklearn進行回歸175 
11.5.9結論176 
11.6線性回歸模型的假設177 
11.7線性回歸模型結果的解釋180 
11.8 Bootstrapping 180 
11.9練習181 
第12章多元數據分析182 
12.1可視化多元相關182 
12.1.1散點圖矩陣182 
12.1.2相關性矩陣182 
12.2多重線性回歸184 
第13章離散數據的檢驗185 
13.1等級資料的組間比較185 
13.2 Logistic回歸186 
13.3廣義線性模型188
13.3.1指數族分佈189 
13.3.2線性預測器和連接函數189 
13.4有序Logistic回歸189 
13.4.1問題定義189 
13.4.2優化191 
13.4.3代碼191 
13.4.4性能191 
第14章貝葉斯統計學193 
14.1貝葉斯學派與頻率學派的解釋193 
14.2計算機時代的貝葉斯方法195 
14.3例子:用馬爾可夫鏈蒙特卡洛模擬分析挑戰者號災難195 
14.4總結198 
參考答案199 
術語表219 
參考文獻223