相關主題
商品描述
本書是一本符合中國科研工作者實際需求的AI科研助理打造指南:
場景化編排
?AI 如何輔助研究設計和理論建構(生成研究假設、構建因果推理框架)
?利用 AI 進行文獻綜述和信息整理(高效篩選文獻、自動摘要、生成引文)
?人工智能輔助數據處理和分析(文本挖掘、輿情分析、定性數據編碼)
?AI 在學術寫作與投稿中的應用(論文框架優化、摘要和引言撰寫、學術翻譯)
本土化視角
?AI 賦能政策研究、政府治理、智庫分析
?AI輔助課題/基金申報和項目撰寫
?政策研究與政府治理分析的 AI 應用
?Local Leader Message Board、微博輿情等數據資源智能化處理
《打造AI科學家:DeepSeek與ChatGPT應用實戰手冊》是一本寫給科研工作者的AI科研助理使用指南,以人工智能技術賦能科學研究為核心,聚焦Deepseek與ChatGPT兩大工具,系統構建從理論研究到實踐操作的完整知識框架。全書以社會科學研究流程為主線,圍繞文獻處理、數據獲取、分析可視化、成果輸出四大核心環節展開,通過具體的場景化案例展現AI技術的賦能路徑。結構設計采用雙工具並行對比的視角:DeepSeek篇深入解析其技術生態與本地化部署能力,覆蓋文獻自動化綜述、虛擬樣本生成、公式推導等深度應用場景;ChatGPT篇聚焦其自然語言交互優勢,針對代碼生成、多語言翻譯、學術寫作潤色等高頻需求提供即用型解決方案。
《打造AI科學家:DeepSeek與ChatGPT應用實戰手冊》主要面向社會科學領域的研究者與實踐者,尤其適合缺乏編程基礎卻需處理海量文獻、覆雜數據的學術群體。人文社科方向的本碩博學生可通過書中提供的對話式指令模板,快速掌握AI實用技能,突破論文寫作技術瓶頸;青年教師與資深學者則可資本書以探索計算社會科學與傳統研究範式的融合路徑。本書尤宜作為開設“數字人文”“社會科學研究方法”等交叉課程的實訓教材,引導學生構建人機協同思維。
本書由孟天廣教授領銜編寫,他是教育部“長江學者”特聘教授、清華大學社會科學學院政治學系長聘教授、計算社會科學與國家治理國家重點實驗室副主任,同時也是國內計算政治學學科的開創者、帶頭人。編寫團隊成員均長期從事計算社會科學研究,在人工智能及其在社會科學中的應用領域具有豐富經驗。相比於一般的 AI 工具指南,本書依托一流學術背景,確保內容的科學性、嚴謹性和前沿性,能夠為學者提供專業且可操作的指導。
目錄大綱
編者自序
DeepSeek篇5
第1章DeepSeek入門5
1.1大語言模型簡介6
1.1.1技術原理6
1.1.2技術生態7
1.1.3 DeepSeek:開放生態的新星8
1.2 DeepSeek系列模型概述9
1.2.1模型架構9
1.2.2性能優勢10
1.3 DeepSeek網頁應用與本地部署11
1.3.1 Web界面11
1.3.2使用本地客戶端12
1.3.3本地部署13
1.4 DeepSeek的API接口16
1.4.1基礎功能調用16
1.4.2高級功能實現17
1.5 DeepSeek的提示詞工程21
1.5.1一般性原則21
1.5.2提示詞示例22
1.6 結語24
第2章DeepSeek與文獻閱讀25
2.1大語言模型輔助文獻閱讀與翻譯26
2.1.1 Zotero 安裝與推薦插件配置26
2.1.2文獻閱讀:GPT 插件安裝與 API 配置26
2.1.3文獻翻譯:Translation for Zotero 插件安裝與 API 配置31
2.2大語言模型協助生成文獻綜述33
2.2.1方法一:使用Zotero中的大模型插件生成文獻綜述33
2.2.2方法二:使用DeepSeek協助生成文獻綜述34
2.3使用DeepSeek協助生成思維導圖37
第3章DeepSeek與調查研究40
3.1調查研究數據收集過程41
3.1.1問卷整體設計41
3.1.2問卷題目設計44
3.1.3問卷質量評估48
3.2調查研究數據清洗過程50
3.2.1變量篩選50
3.2.2樣本取值的編碼51
3.3 DeepSeek輔助進行實驗研究53
3.3.1 DeepSeek輔助進行樣本抽取53
3.3.2 DeepSeek輔助進行實驗幹預設計54
3.4小結61
第4章 矽樣本的生成:系統仿真62
4.1人工智能體(AI Agent)簡介63
4.2 技術基礎與常見工具63
4.2.1技術基礎63
4.2.2常見平臺介紹65
4.3環境設定67
4.4實驗運行與數據收集68
4.4.1實驗運行68
4.4.2數據收集70
第5章DeepSeek與文本數據73
5.1數據抓取74
5.1.1分析網頁結構74
5.1.2編寫爬蟲代碼75
5.2數據特征提取78
5.2.1命名實體識別78
5.2.2覆雜事件抽取81
5.3數據標註84
5.3.1封閉域標註任務:以情感極性為例85
5.3.2開放域標註任務:以主題提取為例88
5.4 小結90
第6章DeepSeek在數據分析中的應用92
6.1數據提取與分析支持93
6.1.1數據清洗與預處理93
6.1.2統計分析支持與結果解讀97
6.1.3數據特征提取與模式識別100
6.2代碼生成與優化101
6.2.1代碼生成101
6.2.2功能增添103
6.2.3代碼糾錯105
第7章DeepSeek與研究成果呈現:校對 翻譯 輔助撰寫基金108
7.1研究成果輔助校對109
7.1.1文本預處理109
7.1.2校對及語境審查110
7.1.3事實核查與數據驗證111
7.1.4邏輯一致性檢查112
7.2研究成果輔助翻譯113
7.2.1角色預設113
7.2.2術語庫支持114
7.2.3翻譯記憶115
7.3輔助撰寫課題申報書116
7.3.1選題價值挖掘116
7.3.2申報書結構化生成117
7.3.3模擬專家評審118
7.4小結118
ChatGPT篇120
第8章ChatGPT 簡介與提示詞工程120
8.1 OpenAI’s GPT簡介121
8.1.1 GPT:生成式預訓練變換器121
8.1.2 ChatGPT:專註於對話生成的應用121
8.1.3 ChatGPT對普通民眾和社會科學研究的幫助122
8.1.4 ChatGPT的使用與 GPTs122
8.1.5小結125
8.2提示詞工程125
8.2.1什麼是提示詞工程125
8.2.2基礎概念126
8.2.3約束回答範圍130
8.2.4提供回答參考133
8.2.5明晰問答結構137
8.2.6其他提示詞優化技巧142
8.3總結145
第9章ChatGPT與理論構建147
9.1知識管理與觀點形成148
9.1.1傳統的知識管理流程148
9.1.2卡片筆記理論(Zettelkasten)150
9.2後工具時代的知識管理151
9.2.1減少知識收集的時間152
9.2.2 AI如何輔助我們思考154
9.3對當下工作流的看法159
9.3.1知識管理工具的演進與應用159
9.3.2社科研究者的一般性工作流159
9.3.3 AI技術對知識管理流程的影響161
9.4總結162
第10章ChatGPT與研究數據獲取、數據清洗163
10.1數據獲取164
10.1.1使用API接口獲取數據164
10.1.2使用爬蟲獲取數據166
10.2數據清洗169
10.2.1數據框數據清洗169
10.2.2文本數據清洗174
10.3 Copilot插件安裝179
10.3.1在Visual Studio中安裝Copilot179
10.3.2在RStudio中安裝Copilot180
10.4小結180
第11章 大模型輔助的矽基樣本生成182
11.1從碳基樣本到矽基樣本183
11.2矽基樣本的方法原理184
11.2.1算法保真:矽基樣本的信度保障184
11.2.2操作策略:基於角色設定的智能體設計185
11.3矽基抽樣的操作:以EDSL為例185
11.3.1概念框架185
11.3.2準備工作187
11.3.3問題設計188
11.3.4使用基於角色設定的智能體開展調查191
11.3.5問卷調查進階:順序、記憶與場景193
11.4小結199
第12章 數據處理203
12.1引言204
12.2數據標註205
12.2.1情感分析205
12.2.2主題建模207
12.3缺失值插補209
12.3.1基於單行的插補210
12.3.2基於數據微調的插補211
12.4大規模的數據處理211
12.5質量評價213
12.5.1評估標準213
12.5.2評估方法214
12.6小結217
第13章 ChatGPT與研究數據分析220
13.1研究數據分析概述221
13.2非結構文本數據的結構化221
13.2.1自動摘要與關鍵信息提取222
13.2.2語義分類與標註223
13.2.3結構化數據表格生成225
13.3數據可視化227
13.3.1常見的研究數據可視化類型228
13.3.2使用 ChatGPT 生成並優化圖表228
13.3.3動態與交互式圖表生成231
13.3.4 LaTeX 表格生成235
13.2.5在社會科學研究中的定制化圖表應用236
13.4編寫代碼與數據分析自動化240
13.4.1使用 ChatGPT 生成代碼241
13.4.2 debug 代碼優化與錯誤調試242
13.4.3實踐案例:使用 ChatGPT 自動化數據分析過程243
13.5總結244
第14章 ChatGPT與研究成果呈現246
14.1文本校對與潤色247
14.1.1基本語法與拼寫校對247
14.1.2學術語言潤色248
14.1.3確保論文邏輯性與連貫性250
14.2多語言翻譯與驗證修改253
14.2.1學術文本的準確翻譯254
14.2.2翻譯結果的驗證與修正255
14.2.3多語言翻譯的質量控制259
14.3成果呈現的自動化與批量處理263
14.3.1使用API實現批量文本校對263
14.3.2自動化翻譯多文檔265
14.3.3生成格式化輸出(如表格或參考文獻)267
14.4數據的隱私保護與合規性268
14.4.1研究數據的隱私保護與合規性268
14.4.2 ChatGPT 使用中的數據加密與存儲要求269
14.5總結269
