光華講壇——社會名流與企業家論壇第6568期
主 題:全基因組罕見變異一體化分析工具STAARpipeline
主講人:東北師范大學數學與統計學院 李子林教授
主持人:統計學院 劉耀午教授
時間:9月15日 下午14:00-15:00
舉辦地點:柳林校區弘遠樓408會議室
主辦單位:統計研究中心和統計學院 科研處
主講人簡介:
李子林,東北師范大學數學與統計學院教授,入選國家級高層次人才青年計劃。歷任印第安納大學醫學院生物統計與健康數據科學系助理教授,哈佛大學生物統計系博士后、副研究員和研究員。本科與博士畢業于清華大學數學科學系,師從美國國家科學院與醫學院兩院院士林希虹院士。2023年當選為國際統計學會(International Statistical Institute)推選會員(Elected Member)。主要研究方向為高維數據中的統計方法理論和統計遺傳學。相關研究成果以第一作者或通訊作者在Journal of American Statistical Association、 Nature Methods和Nature Genetics等國際學術期刊發表。
內容簡介:
大規模的全基因組測序 (whole-genome sequencing, WGS) 研究對上百萬個全基因組進行了測序,發現了近十億個變異位點,其中罕見變異(rare variants)占比率超過了99%。海量的罕見變異數據在分析上提出了一系列的挑戰:首先,全基因組測序數據分析缺乏全面且高效的分析軟件和工具。其次,超過98%的遺傳變異位于非編碼基因組。雖然在識別致病編碼罕見變異方面取得了一些進展,但非編碼罕見變異分析仍存在巨大的研究空白。最后,雖然多組學數據中的功能注釋數據提供了變異的功能性信息,現有的罕見變異關聯分析方法尚未有效地利用這些信息。為了解決這些問題,我們開發了名為STAARpipeline的一體化分析工具,專門用于大規模全基因組數據的罕見變異分析。STAARpipeline提供了一個可擴展、靈活且簡化的分析框架,實現了分析流程的一體化和自動化。其功能包括全基因組功能注釋、常見和罕見變異關聯分析、條件分析以及分析結果的匯總和可視化。STAARpipeline中發展了一系列新方法來選擇非編碼基因組中的罕見變異分析單位,顯著地提高了檢驗功效。同時通過STAAR方法整合多組學功能注釋數據,STAARpipeline進一步實現了功能知情(functionally-informed)關聯分析,增強了罕見變異分析的功效。本研究為全基因組數據提供了一個高效、高性能的分析工具,突破了全基因組測序數據罕見變異分析的運算和功效瓶頸,有助于加速新藥物標靶的發現和精準健康的研究進程。