轉(zhuǎn)錄組測(cè)序是利用第二代高通量測(cè)序技術(shù)快速獲取某一物種特定器官或組織在某一狀態(tài)下幾乎所有轉(zhuǎn)錄本的序列信息,進(jìn)行疾病與正常樣本間的基因表達(dá)差異分析、可變剪切和融合基因分析,尋找與癌癥、遺傳病相關(guān)的致病基因,已廣泛應(yīng)用于基礎(chǔ)研究、臨床診斷和藥物研發(fā)等領(lǐng)域。相對(duì)于傳統(tǒng)芯片而言,無(wú)需預(yù)先設(shè)計(jì)特異性探針,具有分辨率高、檢測(cè)范圍廣和準(zhǔn)確率高的優(yōu)點(diǎn)。
實(shí)驗(yàn)方案
測(cè)序策略:Illumina 平臺(tái) PE150
數(shù)據(jù)量:6G/樣
技術(shù)優(yōu)勢(shì)
(1)任意物種檢測(cè):相對(duì)于傳統(tǒng)芯片而言,無(wú)需預(yù)先設(shè)計(jì)特異性探針,因此無(wú)需了解物種基因或基因組信息,能夠直接對(duì)任何物種進(jìn)行最全面的轉(zhuǎn)錄組分析;
(2)分辨率高:可以檢測(cè)基因家族中相似基因及可變剪接造成的單堿基差異;
(3)檢測(cè)范圍廣:從幾個(gè)到數(shù)十萬(wàn)個(gè)拷貝精確計(jì)數(shù),可同時(shí)鑒定正常和稀有的轉(zhuǎn)錄本;
(4)信息分析全面:可以做基因差異表達(dá)分析、可變剪切、融合基因分析、新轉(zhuǎn)錄本預(yù)測(cè)及注釋。
信息分析
標(biāo)準(zhǔn)信息分析
(1)按標(biāo)準(zhǔn)流程進(jìn)行數(shù)據(jù)整理及數(shù)據(jù)質(zhì)量評(píng)估;
(2)與參考序列比對(duì),計(jì)算不同基因的RPKM值;
(3)基因的差異表達(dá)分析;
(4)樣本間基因表達(dá)水平的相關(guān)性分析(僅限于有生物重復(fù)的樣本);
(5)樣本間差異基因韋恩圖及PCA分析;
(6)差異基因的表達(dá)模式聚類分析;
(7)差異表達(dá)基因GO功能富集分析;
(8)差異表達(dá)基因Pathway顯著富集分析;
(9)差異表達(dá)基因的蛋白質(zhì)互作網(wǎng)絡(luò)分析;
(10)條件特異表達(dá);
(11)鑒定基因的可變剪切;
(12)SNP/InDel分析;
(13)新轉(zhuǎn)錄本預(yù)測(cè)及注釋;
(14)融合基因分析(僅限于人);
高級(jí)信息分析
(1)基因結(jié)構(gòu)優(yōu)化(只針對(duì)真核生物)
(2)RNA編輯
(3)差異基因的轉(zhuǎn)錄因子分析(適用于植物)
技術(shù)流程
轉(zhuǎn)錄組測(cè)序案例分析
案例(1)科學(xué)家繪制細(xì)胞周期的高分辨率轉(zhuǎn)錄組圖譜
細(xì)胞周期的推進(jìn)很大程度上依賴于周期性基因表達(dá)。本研究繪制了細(xì)胞周期的高分辨率轉(zhuǎn)錄組圖譜,揭示了周期性基因與癌癥之間的新關(guān)聯(lián)。研究人員在兩個(gè)連續(xù)的細(xì)胞周期中對(duì)人類細(xì)胞進(jìn)行RNA測(cè)序,鑒定了一千多個(gè)周期性表達(dá)的mRNA、非編碼RNA和假基因。研究顯示,這些周期性轉(zhuǎn)錄本主要集中在與DNA代謝、有絲分裂和DNA損傷應(yīng)答有關(guān)的功能上。他們分析了癌癥基因組圖譜TCGA和其他數(shù)據(jù)庫(kù)的四千多個(gè)腫瘤樣本,證實(shí)“有絲分裂特征”與遺傳改變、腫瘤類型和患者生存狀況有顯著的關(guān)聯(lián)。研究人員還定義了67個(gè)核心基因,這些基因在多種細(xì)胞中均有很強(qiáng)的周期性表達(dá)。
圖1 細(xì)胞周期核心基因的表達(dá)特征
案例(2)人類組織和個(gè)體的轉(zhuǎn)錄組差異
轉(zhuǎn)錄調(diào)控和轉(zhuǎn)錄后加工影響許多細(xì)胞和器官的表型。基因型組織表達(dá)(GTEx)項(xiàng)目通過(guò)RNA測(cè)序得到的數(shù)據(jù)探索個(gè)體和組織間的轉(zhuǎn)錄組類型的變化差異。本研究從175個(gè)個(gè)體的43個(gè)身體部位采集得到1641份樣本,包括29份器官組織、11份腦亞區(qū)、全血和兩份細(xì)胞系。轉(zhuǎn)錄組測(cè)序數(shù)據(jù)表明,平均每個(gè)樣本得到8千萬(wàn)比對(duì)到的片段數(shù)。尸體的組織樣本表現(xiàn)出帶有特點(diǎn)的并且穩(wěn)定性強(qiáng)的轉(zhuǎn)錄組信號(hào)。個(gè)體之間表現(xiàn)出高度基因表達(dá)差異,包括不同性別、種族和年齡的患病人群。原始轉(zhuǎn)錄是細(xì)胞特異性的主要驅(qū)動(dòng)因子,后期剪切行使補(bǔ)充性角色。差異剪切可能在鑒定個(gè)體表型中行使更加重要的作用。
圖1 樣本和組織的表達(dá)譜相似性分析
案例(3)錫蘭鉤蟲(chóng)基因組和轉(zhuǎn)錄組的解析為藥物靶向奠定基礎(chǔ)
該研究針對(duì)致病性寄生蟲(chóng)錫蘭鉤蟲(chóng)基因組進(jìn)行了深度測(cè)序,該寄生蟲(chóng)基因組大小約313Mb。測(cè)序獲得了其每個(gè)生長(zhǎng)周期的轉(zhuǎn)錄組數(shù)據(jù)并進(jìn)行深度分析,感染期共有30,738條基因表達(dá)。大約有900條基因在感染早期下調(diào)。基于這些測(cè)序數(shù)據(jù),研究者成功挖掘獲得錫蘭鉤蟲(chóng)生命周期中各節(jié)點(diǎn)處許多重要的功能基因信息,這些功能基因信息中存在能夠治療或阻斷錫蘭鉤蟲(chóng)引起致病性的重要靶向位點(diǎn)信息等。
圖1 不同感染期的錫蘭鉤蟲(chóng)的基因表達(dá)差異情況
參考文獻(xiàn)
[1] Dominguez et al. A high-resolution transcriptome map of cell cycle reveals novel connections between periodic genes and cancer. Cell Research, 2016.
[2] Melé et al. The human transcriptome across tissues and individuals. Science, 2015.
[3] Schwarz et al. The genome and transcriptome of the zoonotic