期刊VIP學術指導 符合學術規范和道德
保障品質 保證專業,沒有后顧之憂
摘要 [目的]了解槐豬和杜洛克豬背部皮下脂肪組織脂肪沉積的分子機制差異。[方法]對槐豬和杜洛克豬背部皮下脂肪組織進行轉錄組測序,并進行生物信息學分析。[結果]槐豬和杜洛克豬分別獲得37 858 968和37 545 394條干凈讀段(clean reads)。槐豬和杜洛克豬分別預測到9 612和9 457可變剪接事件;兩豬種間共有709個差異表達基因,與杜洛克豬相比,槐豬有395個上調基因和314個下調基因。差異表達基因共歸類到46個GO條目中,其中細胞組分11個、分子功能12個及生物學過程23個;顯著富集的KEGG通路共計9個,其中含有與調節脂類代謝顯著相關通路,如胰島素信號通路和PPAR信號通路等。[結論]該研究可為今后研究脂肪沉積的遺傳機理提供科學依據。
關鍵詞 槐豬;杜洛克豬;背部皮下脂肪組織;差異表達;轉錄組測序
脂肪沉積性狀是豬主要的經濟性狀之一,且與經濟價值緊密聯系。槐豬(Huai Pig)是福建省特色豬品種,早熟易肥,肉質優良,抗逆性強,但生長速度慢,瘦肉率低,是典型的脂肪型豬種,而西方現代豬種杜洛克豬(Duroc Pig)生長速度快,瘦肉率高,但肉質和抗逆性相對較差,是典型的瘦肉型豬種。為了解槐豬和杜洛克豬皮下脂肪組織脂肪沉積的分子機制差異,筆者對這兩個豬種背部皮下脂肪進行了轉錄組測序,并進行了生物信息學分析。
1 材料與方法
1.1 試驗材料與測序
選擇在相近飼養條件下同期飼養的190日齡槐豬和杜洛克豬各3頭,屠宰后分別取倒數第3~4根肋骨之間的背部皮下脂肪組織,置于液氮中貯存;采用TRIzol法提取各樣品的總RNA,并采用Nanodrop、Agilent 2100方法對RNA樣品的純度、濃度和完整性進行檢測,將符合測序要求的槐豬和杜洛克豬的總RNA分別等量混合,形成2個總RNA池,送交北京百邁客生物科技有限公司進行轉錄組測序(RNAseq)。
1.2 數據整理和分析
1.2.1 原始數據去雜。
測序所獲得的原始序列數據均帶有一段3′接頭序列,并且含有少量低質量序列以及各種雜質成分,經過數據處理得到可用的干凈讀段(clean reads)。 具體處理方法如下:去除3′接頭序列、去除空載讀長、去除低質量讀段(含有未知堿基N的讀段)、去除長度過小或過大的讀段等[1]。
1.2.2 序列比對和基因表達量分析。
使用TopHat軟件將獲得的干凈讀段(clean reads)與豬參考基因組(Sus scrofa 10.2:ftp://ftp.ensembl.org/pub/release75/fasta/sus_scrofa/)進行比對,并對比對效率進行統計[2]。采用FPKM(fragments per kilobase of transcript per million fragments mapped)作為衡量轉錄本或基因表達水平的指標[3],FPKM計算公式如下:
FPKM=基因區的讀段數目×109基因長度×測序深度(1)
1.2.3 可變剪切預測。
使用Cufflinks軟件對基因原有的剪接模型進行比較,進行可變剪接事件(alternative splicing events)預測[3]。常見的可變剪接可分為6種類型:外顯子跳躍(exon skipping,ES)、內含子保留(intron retention,IR)、第一個外顯子可變剪接(alternative first exon,AFE)、最后一個外顯子可變剪接(alternative last exon,ALE)、5′端可變剪接(alternative 5′ splice site,A5SS)、3′端可變剪接(alternative 3′ splice site,A3SS)[4-5]。
1.2.4 基因功能注釋及差異表達基因篩選。
使用BLASTX軟件將基因序列與Nr、SwissProt、GO、COG和KEGG數據庫進行比對,獲得所有基因的注釋信息。使用R軟件的EBSeq包進行基因差異表達分析[6],以=|log2(FC)|≥1且FDR<0.01作為篩選差異基因的標準。其中,差異倍數(fold change,FC)表示兩樣品之間表達量的比值,錯誤發現率(false discovery rate,FDR)是對差異顯著性P值進行BenjaminiHochberg方法校正后得到的[7]。
1.2.5 GO功能分類。
使用Blast2GO軟件對差異表達基因進行GO功能分類,參數e值≤10-5[8],并使用WEGO軟件進行統計并繪圖。GO(gene ontology)數據庫能對基因、蛋白質進行描述,其包含3個本體:細胞組分(cellular component)、分子功能(molecular function)和生物學過程(biological process)。
1.2.6 KEGG通路顯著性富集分析。
以KEGG通路為單位,找出與整個基因組背景相比在差異表達基因中顯著性富集的通路,其計算公式如下:
P=1-∑m-1i=0
Mi
N-Mn-i
Nn
(2)
式中,N為所有基因中具有通路注釋的基因數目;n為具有通路注釋基因中差異表達基因的數目;M為所有基因中注釋為某特定通路的基因數目;m為注釋為某特定通路的差異表達基因數目。Q≤0.05的通路定義為在差異表達基因中顯著富集的通路(Q表示錯誤比例,Q=V/R,其中R代表所挑選的差異基因個數,V代表沒有差異表達的基因個數,即假陽性結果)[1]。
2 結果與分析
2.1 測序數據質量評估
對槐豬和杜洛克豬背部皮下脂肪組織進行轉錄組測序,獲得原始讀段數目分別為46 891 554和45 309 436條,原始讀段經過去雜處理后,獲得的干凈讀段數分別為37 858 968和37 545 394 條,其中78.54%和82.08% 的干凈讀段(clean reads)比對上豬參考基因組,可以滿足后續分析的需要。
2.2 可變剪切預測
槐豬和杜洛克豬背部皮下脂肪組織分別預測到9 612和9 457可變剪接事件。由圖1可知,在6個常見的可變剪切類型中外顯子跳躍的數量最多。
2.3 差異表達基因篩選和注釋
對槐豬和杜洛克豬背部皮下脂肪組織進行轉錄組測序,并進行差異表達基因篩選。結果發現,兩豬種共有709個差異表達基因,與杜洛克豬相比槐豬有395個上調基因和314個下調基因。各個數據庫注釋到的差異表達基因數目及所占比例如表1所示。
2.4 GO功能分類 由圖2可知,槐豬和杜洛克豬背部皮下脂肪組織的差異表達基因共歸類到46個GO條目中,其中細胞組分11個、分子功能12個及生物學過程23個。細胞組分中分類到較多基因的條目為cell part、cell和organelle,分別含540、540和394個基因;分子功能中的條目binding含450個基因;生物學過程中的條目cellular process、metabolic process和biological regulation分別含519、462和412個基因。
2.5 KEGG通路顯著性富集分析
槐豬和杜洛克豬背部皮
下脂肪組織之間的差異表達基因共顯著富集到9個KEGG通路,通路信息如表2所示。
3 討論
該研究對槐豬和杜洛克豬背部皮下脂肪組織進行轉錄組測序,分別獲得了37 858 968和37 545 394條干凈讀段。陳偉[9]對萊蕪豬和大白豬背最長肌的轉錄組測序分別獲得40 498 476 和59 072 892條干凈讀段。Sodhi等[10]對濟州島本地豬和巴克夏豬的脂肪組織進行了測序,分別獲得41 411 459 和40 308 452條干凈讀段。由此可見,對不同豬品種同一個組織測序所獲得的干凈讀段數目不同;對同一個豬品種的不同組織的測序所獲得的干凈讀段數目也不同,這可能是由于不同組織所行使的生理功能和所含的基因數目不同。
推薦閱讀:農業科技創新論文文獻如何檢索