Stata 數據分析與建模
曹啟龍、佟金萍
- 出版商: 清華大學
- 出版日期: 2025-04-01
- 售價: $474
- 語言: 簡體中文
- 頁數: 309
- ISBN: 7302682658
- ISBN-13: 9787302682653
-
相關分類:
Data Science
下單後立即進貨 (約4週~6週)
買這商品的人也買了...
-
$258$245 -
$354$336 -
$520$442 -
$352人工智能算法 捲2 受大自然啟發的算法
-
$403速通機器學習
-
$568金融中的機器學習
-
$714$678 -
$1,014$963 -
$414Python大數據分析Big Data Analysis with Python
-
$774$735 -
$419$398 -
$299數據挖掘技術(微課視頻版)
-
$299統計計算
-
$828$787 -
$594$564 -
$600$570 -
$458R語言數據分析從入門到精通
-
$1,015資料分析與預測演算法:基於 R語言
-
$359$341 -
$454深度學習與大模型基礎(簡體書)
-
$301最優化理論與智能算法
-
$300$270 -
$414$393 -
$474ESG投資
-
$594高級計量經濟分析及 Stata 應用
商品描述
本書以數據分析特別是大數據的整理、清洗、分析以及建模為主線,從基礎入門到進階分析再到實踐應用,層層遞進。主要內容包括軟件介紹、數據重整、數據可視化、Stata軟件編程基礎以及不同場景下的應用。本書的特色在於軟件介紹詳細全面、結合教學和科研一線實際需求,教材案例內容豐富,理論與實踐性較強。本書的讀者以高年級本科生、研究生為主,博士生和科研工作者均可作為參考書。本書的讀者以高年級本科生、研究生為主,博士生和科研工作者均可作為參考書。
作者簡介
佟金萍 常州大學商學院·劉國鈞管理學院教授、河海管理學博士、加拿大滑鐵盧大學訪問學者、博士生導師、商學院·劉國鈞管理學院院長。講授“計量經濟學”“管理定量分析方法”等本科生與研究生課程。主要研究方向為資源配置管理與政策分析災害應急管理等領域。主持國家級社科基金項目3項、中國博士後科學基金項目1項、教育部人文社科基金項目1項、國家重點實驗室課題1項。入選江蘇省“333工程”“青藍工程”“紫金文化”人才項目4項。在《系統工程理論與實踐》《資源科學》《系統工程》等期刊發表論文50餘篇,出版專著3部,主編教材4部,獲得省部級獎6項。現為《軟科學》、《資源科學》、The International Journal of Environmental Research and Public Health、Sustainability等期刊匿名審稿人。
目錄大綱
目錄
第1章Stata的環境設置
1.1Stata的界面與參數設定
1.1.1Stata的界面概述
1.1.2Stata的界面調整
1.1.3系統參數的查看與設定
1.1.4Stata的基本語法
1.2工作路徑設置與文件操作
1.2.1工作路徑設置命令
1.2.2文件/文件夾操作命令
1.2.3打印與顯示
1.2.4清空命令
1.3命令的安裝與更新
1.3.1命令的安裝
1.3.2命令的更新
1.4幫助命令與相關資源
1.4.1幫助文檔
1.4.2官方資源
1.4.3國內資源
1.5do文檔及其註釋
1.6系統文件路徑與profile設置
1.6.1系統文件路徑
1.6.2profile設置
1.7日誌命令
習題
第2章數據導入導出與基本分析
2.1手動導入數據
2.2dta格式文件的導入與導出
2.2.1sysuse和webuse命令
2.2.2use命令
2.3文本文件的導入與導出
2.3.1字符分隔文本的導入
2.3.2固定格式文本的導入
2.3.3文本文件的導出
2.4Excel文件的導入與導出
2.4.1Excel文件的導入
2.4.2Excel文件的導出
2.4.3labone命令與nrow命令
2.4.4xls2dta命令
2.5數據檢查與數據校對
2.5.1describe命令
2.5.2codebook命令
2.5.3summarize命令
2.5.4sumup命令
2.5.5inspect命令
2.5.6count命令
2.5.7distinct命令
2.5.8tab與fre命令
2.5.9center命令
2.5.10assert命令
2.5.11unique命令
2.5.12lookfor命令
2.5.13list命令
2.5.14levelsof命令
2.6統計報表與統計分析
2.6.1tabstat命令
2.6.2table命令
2.6.3tabulate命令
2.6.4分位數命令
2.6.5相關性分析
2.6.6點估計與區間估計
2.6.7假設檢驗
2.6.8方差分析
2.6.9正態分佈檢驗
2.6.10線性回歸分析
習題
第3章變量的生成與設定
3.1運算符
3.1.1算術運算
3.1.2比較運算
3.1.3邏輯運算
3.2標量及操作
3.3變量的命名
3.3.1變量命名的基本規則
3.3.2_n與_N
3.3.3Stata文檔中的變量符號
3.4gen、replace與egen命令
3.5變量操作
3.5.1變量的保留與刪除
3.5.2變量值的提取
3.5.3變量順序的調整與觀測值的排序
3.6變量重命名與變量標簽
3.6.1變量的重命名
3.6.2變量標簽的設定
3.7生成分組變量
3.7.1利用gen與replace生成分組變量
3.7.2利用cond()函數生成分組變量
3.7.3利用recode命令生成分組變量
3.7.4inlist()、inrange()函數與inlist2命令
3.7.5利用mod()函數實現順序分組
3.7.6利用egen命令與group()函數實現交叉分組
習題
第4章變量的類型與操作轉化
4.1變量類型轉化
4.1.1變量類型轉化的命令
4.1.2變量類型轉化的函數
4.2特殊數據的處理
4.2.1重復值的處理
4.2.2缺失值的處理
4.2.3離群值
4.3變量格式的設定
4.3.1format命令簡介
4.3.2format設定格式的常見類型
4.4時間序列變量操作符
4.5因子變量操作符
習題
第5章數據重構
5.1數據拆分
5.1.1橫向拆分數據
5.1.2縱向拆分數據集
5.2數據合並
5.2.1縱向合並數據
5.2.2橫向合並與匹配
5.2.3交叉合並
5.3數據長寬轉化
5.3.1reshape命令
5.3.2spread命令與gather命令
5.4數據轉置
5.4.1數值型變量轉置
5.4.2字符型變量轉置
5.5變列操作
5.5.1一列變多列
5.5.2多列變一列
習題
第6章函數
6.1日期函數
6.1.1日期數據的形式與格式設定
6.1.2字符型日期的提取
6.1.3數值型日期的提取與合並
6.2數學函數
6.3統計函數
6.3.1分佈函數與概率密度函數
6.3.2正態分佈
6.3.3t分佈
6.3.4卡方分佈
6.3.5F分佈
6.3.6快速呈現常用分佈的臨界值表
6.4隨機數函數
6.5字符串函數
6.5.1字符與數值轉換函數
6.5.2字符串的縮寫與擴展
6.5.3字符示性函數
6.5.4替換函數
6.5.5截取函數
6.5.6匹配函數
6.5.7字符統計類函數
6.5.8刪除字符串中的空格
6.5.9字符大小寫轉化
6.5.10轉碼函數
習題
第7章矩陣
7.1矩陣的生成
7.1.1矩陣的定義
7.1.2生成特定格式矩陣
7.1.3矩陣行和列的命名
7.1.4矩陣和變量的轉化
7.2矩陣元素的提取
7.3矩陣的運算
7.4矩陣中的函數
習題
第8章宏與返回值
8.1local與global
8.1.1局部宏local
8.1.2全局宏global
8.2宏擴展函數dir的用法
8.3臨時文件的創建與恢復
8.4標量scalar
8.4.1標量的定義
8.4.2local與scalar的區別
8.5Stata命令的返回值
8.5.1r類返回值
8.5.2e類返回值
8.5.3c類返回值
8.5.4s類命令
習題
第9章Stata循環與判斷語句
9.1while語句
9.2forvalues語句
9.3foreach語句
9.4continue與break語句
9.5嵌套循環與if語句
習題
第10章Stata程序編寫
10.1程序文件do與ado
10.2程序的定義program
10.3程序的參數輸入
10.4在程序中定義語法
10.5confirm語句
10.6capture語句
10.7marksample
10.8tokenize
10.9綜合案例
習題
第11章數據分析應用專題
11.1字符串變量處理
11.1.1字符串變量處理常用命令
11.1.2正則表達式
11.2滾動窗口
11.2.1移動平均與滾動平均
11.2.2移動平均的簡單命令
11.2.3滾動窗口統計
11.2.4滾動窗口回歸
11.3分組計算
11.3.1組內元素個數統計
11.3.2分組統計與回歸分析
11.3.3按類別求除自身之外的平均值
11.3.4HHI類指數的計算
11.3.5分組回歸提取殘差
11.4地理計算與近鄰地區匹配
11.4.1基於經緯度的地理距離計算
11.4.2相鄰地區匹配與計算
習題
第12章數據可視化
12.1圖形的類型
12.2圖形管理
12.3graph twoway系列命令介紹
12.4graph twoway的graph region選項
12.4.1scheme(schemename)
12.4.2title_options
12.4.3legend_options
12.4.4axis_options
12.4.5added_line_options
12.4.6added_text_options
12.4.7by(varlist,…)
12.4.8scale(#)
12.4.9region_options
12.4.10aspect_options
12.4.11name(name,…)
12.4.12saving(filename,…)
12.5graph twoway的plot region選項
12.5.1散點圖
12.5.2線圖
12.5.3條形圖
12.5.4直方圖
12.5.5函數圖
12.6繪圖綜合案例
習題
第13章數據分析結果的報告
13.1數據分析結果匯報命令
13.1.1x2docx類命令
13.1.2esttab命令
13.1.3outreg2命令
13.2綜合案例
13.2.1案例背景
13.2.2數據介紹
13.2.3研究設計
13.2.4數據分析
13.2.5案例小結
習題
第14章蒙特卡洛模擬與自抽樣
14.1抽樣的常用命令
14.1.1sample
14.1.2bsample
14.1.3splitsample
14.1.4drawnorm
14.2蒙特卡洛模擬
14.2.1蒙特卡洛模擬簡介
14.2.2蒙特卡洛模擬的基本命令
14.2.3蒙特卡洛模擬案例
14.3自抽樣
習題
附錄AStata發展歷程簡介
附錄Begen中的函數簡介
參考文獻