中央政府科技研發績效彙編109年度 附錄

(4) 建立涵蓋全球人類族群多樣性的參考基因組 目前的人類參考基因體的序列主要來自單一個體,因此,它無法充分 反應人類遺傳的多樣性。在本研究中,中央研究院和加州大學舊金山分校的 研究小組分析來自世界各種族的 338 個人 ( 包括來自臺灣的 154 人 ) ,利用 其所產生的高質量人類基因組,得以找出人類參考基因體中的缺失序列。總 體而言,我們確定 127,727 筆原本人類參考基因體所沒有的序列,一共為 18,048,877 bp 。其中一些新的序列被發現位於已知外顯子和調控元件中, 進而影響該基因的表現。為改善基因組的註釋,我們將這些新發現的序列線 性整合到人類參考基因體中,來構建涵蓋全球人類族群多樣性的參考基因組。 402,573 個先前無法對應人類參考基因體的序列在約 40X 覆蓋率的情況下, 可以在這個新的人類參考基因組找到正確的對應位置。此外,我們也成功地 將數以萬計個在先前 RNA 定序中無法定位而被丟棄的序列,利用此一新的人 類參考基因體在 4781 個基因位點中成功定位。這些證據強調這些原本在人 類參考基因體的缺失序列,在功能基因組學中的重要性。藉由這些廣泛的數 據資料組,我們得以朝著建立包含全球人類遺傳多樣性的完整人類參考基因 體,邁出的重要一步。 21

RkJQdWJsaXNoZXIy NDEyMzQ=