《Nature Genetics》雜志詳細介紹了這種稱為Cis表達或cis-X的方法,這是一種創新的分析方法,在患者腫瘤的調控非編碼DNA中識別新的致病性變體和由這種變體激活的癌基因。cis-X通過識別腫瘤RNA的異常表達發揮作用。研究人員分析了白血病和實體瘤,并證明了這種方法的有效性。
不編碼基因的非編碼DNA占人類基因組的98%。越來越多的證據表明,超過80%的非編碼基因組是功能性的,可能調節基因表達。大量人群研究已經確定了非編碼DNA中與癌癥風險升高相關的變異。但是,在腫瘤基因組中,只有少量的非編碼變異導致了腫瘤的發生。發現這些變異需要對大量腫瘤樣本進行全基因組測序分析。
“cis-X是一個根本性的改變,現有的方法需要數千個腫瘤樣本,只識別反復發生的非編碼變體,”St.Jude計算生物學系主任Jinghui Zhang博士說。她和上海兒童醫學中心的Yu Liu博士是本文的通訊作者。劉博士也是第1作者。
“通過使用異常的基因轉錄來揭示非編碼變體的功能,我們開發了cis-X,從而能夠在單個腫瘤基因組中發現驅動癌癥的非編碼變體,”張博士說。“識別導致癌基因失調的變異可以將精-確醫學的范圍擴大到非編碼區域,以確定抑制腫瘤中異常激活癌基因的治療方案。”
cis-X的靈感來源于2014年Dana Farber癌癥研究所的Thomas Look醫學博士及其同事的一篇科學論文。Look也是這篇論文的合著者。Look的研究小組在
細胞系中發現了導致癌基因(TAL1)異常激活導致T細胞急性淋巴細胞白血病(T-ALL)的非編碼DNA變體。這項研究促使張博士繼續她長期以來的興趣,即研究基因每個拷貝的表達變化。
cis-X通過兩種方式尋找表達改變的基因。研究人員利用全基因組和RNA測序來尋找只在一條染色體上表達并在異常高水平表達的基因。
“當分析等位基因之間基因表達的不平衡時,可能會產生噪音,”劉博士說。“這項分析使用了一種新穎的數學模型,使cis-X成為一種強大的發現工具。”
然后cis-X通過在3D基因組結構中尋找非編碼DNA調控區域的變化來尋找異常表達的原因。“這種方法模仿了變種在活細胞中的工作方式。這些變化包括染色體重排和點突變等變化。
“如果不確定非編碼變體,我們可能無法全面了解導致癌癥的原因。”
研究人員使用cis-X分析了13例T-ALL患者的癌癥基因組,這些數據是由圣裘德和上海兒童醫學中心合作收集的。該算法識別已知和新的癌基因激活非編碼變體,以及可能的新的T-ALL癌基因PRLR。
研究人員還表明,這種方法在成人和兒童實體瘤中有效,包括神經母細胞瘤。實體瘤對分析提出了更大的挑戰。與白血病不同的是,實體瘤分布在腫瘤內的染色體數目往往不均勻。
“cis-X為研究非編碼變體在癌癥中的功能作用提供了一種強有力的新方法,這可能會擴大精-確藥物治療由此類變體引起的癌癥的范圍,”張博士說。