融合多組學數據預測染色質開放性的機器學習方法
圖書分類:學術專著
- 出版商: 清華大學
- 出版日期: 2025-07-01
- 售價: $594
- 語言: 簡體中文
- 頁數: 146
- ISBN: 7302693331
- ISBN-13: 9787302693338
-
相關分類:
Machine Learning
下單後立即進貨 (約4週~6週)
相關主題
商品描述
"《融合多組學數據預測染色質開放性的機器學習方法》以染色質開放性數據的信息解讀為主線,通過融合多種組學數據的方式,研究預測染色質開放性的機器學習方法、探索單細胞染色質開放性數據分析的理論與方法;系統性地研究了細胞群與單細胞染色質開放性數據分析中的關鍵問題,對生物數據解讀中的概率密度估計等共性基礎問題進行了創新性探索,研究成果不僅能對大規模染色質開放性數據進行高效分析,還能加強對細胞調控機制的深入理解,從而促進對遺傳學數據的有效解讀。 《融合多組學數據預測染色質開放性的機器學習方法》可供生物信息學、遺傳學及染色質開放性數據分析等領域的高校師生和科研院所研究人員及相關技術人員閱讀參考。"
作者簡介
劉橋,作者博士畢業於清華大學自動化系,現為美國斯坦福大學博士後研究員。主要研究方向為機器學習與計算生物學。曾獲清華大學優秀博士畢業論文,清華大學優秀畢業生,北京市優秀畢業生等榮譽,以第一作者的身份在Nature子刊,美國科學院院刊PNAS,Bioinformatics等**學術刊物發表學術論文多篇。
目錄大綱
目 錄
第 1 章 引言 1
1.1 研究背景與意義 1
1.1.1 高通量測序技術 3
1.1.2 染色質開放性 5
1.1.3 基因調控機制 10
1.2 研究現狀與不足 12
1.2.1 細胞群染色質開放性預測方法 12
1.2.2 單細胞染色質開放性分析方法 15
1.3 本書研究內容與貢獻 18
1.4 本書內容安排 21
1.5 小結 22
第 2 章 基於序列信息的染色質開放性預測方法 23
2.1 引言 23
2.2 整合序列進化保守性的隨機森林預測方法 24
2.2.1 研究背景與動機 24
2.2.2 基於隨機森林的 kmerForest 模型 26
2.2.3 kmerForest 模型準確預測染色質開放性 27
2.2.4 利用 kmerForest 模型促進遺傳變異數據的解釋 31
2.2.5 分析與小結 33
2.3 結合 k 聚體特征的混合卷積神經網絡預測方法 34
2.3.1 研究背景與動機 34
2.3.2 基於混合神經網絡的 Deopen 模型 36
2.3.3 Deopen 準確預測染色質開放性二值狀態 39
2.3.4 Deopen 準確恢復連續染色質開放性信號 44
2.3.5 神經網絡卷積核的生物解釋 48
2.3.6 分析與小結 50
2.4 小結 54
第 3 章 融合組學數據的跨細胞系染色質開放性預測方法 55
3.1 引言 55
3.2 研究背景與動機 56
3.3 基於密集連接卷積網絡的 DeepCAGE 模型 58
3.3.1 模型設計架構 58
3.3.2 模型評價方法 59
3.3.3 實驗數據準備和預處理 61
3.4 DeepCAGE 模型預測性能 63
3.4.1 DeepCAGE 準確預測跨細胞系染色質開放性二值狀態 63
3.4.2 DeepCAGE 準確恢復跨細胞系染色質開放性連續信號 64
3.4.3 針對 DeepCAGE 模型的消融性分析 67
3.5 DeepCAGE 模型的生物學應用與解釋 69
3.5.1 基於梯度的轉錄因子的優先排序分析 69
3.5.2 神經網絡卷積核的可視化與信息熵分析 71
3.6 DeepCAGE 模型在解讀全基因組測序數據上的應用 72
3.6.1 建立全基因組測序變異位點影響的評估方法 72
3.6.2 全基因組數據測序變異位點的排序分析 73
3.6.3 從全基因組突變位點到復雜表型的建模與解釋 74
3.7 小結 75
第 4 章 基於深度生成式模型的單細胞染色質開放性分析方法 77
4.1 引言 77
4.2 研究背景與動機 79
4.3 基於循環對抗生成式網絡的概率密度估計模型 Roundtrip 80
4.3.1 概率密度估計的建模與求解方法 81
4.3.2 概率密度估計模型的遷移 86
4.4 解析單細胞染色質開放性的 scDEC 模型 87
4.4.1 scDEC 模型設計架構 87
4.4.2 模型的對抗式訓練 89
4.4.3 模型評價方法 92
4.4.4 實驗數據準備與預處理 94
4.5 scDEC 模型在細胞類型發現上的性能表現 97
4.5.1 scDEC 在多個數據集上細胞聚類性能上優於已有方法 97
4.5.2 scDEC 在大規模 scATAC-seq 數據下的性能分析 109
4.5.3 scDEC 模型在單細胞多組學數據上的性能分析 109
4.6 scDEC 促進下遊生物應用與發現 113
4.6.1 利用 scDEC 模型促進細胞特異性 motif 分析 113
4.6.2 利用 scDEC 模型促進細胞軌跡推斷分析 118
4.6.3 利用 scDEC 模型消除單細胞數據中的實驗技術噪聲 119
4.7 小結 122
第 5 章 總結與展望 126
5.1 總結 126
5.2 未來展望 128
參考文獻 130