© 2021 BIOTOOLS Co., Ltd. All Rights Reserved

latest news

最新消息

11 2025.06

蛋白質體學-生物資訊分析專欄I

蛋白質體學-生物資訊分析專欄I
 

▌從差異蛋白出發:挖掘數字背後的生物學意義


當我們做完實驗,得到一份差異蛋白(Differential protein) 數據後,下一步該怎麼走?光知道哪些蛋白上調或下調還只是開始——真正關鍵的是,這些蛋白在生物體內到底扮演什麼角色?它們牽涉到哪些疾病機制?還是彼此之間有交互關係?
這時候,後續的生物資訊分析就成為認識這些差異蛋白的重要窗口!

 

▌​差異蛋白視覺化:快速掌握樣本間趨勢與顯著變化


➤ 熱圖(Heatmap)與火山圖(Volcano Plot):理解差異的起點
這兩種圖常作為差異蛋白資料的初步探索工具:

  • 熱圖:利用顏色深淺變化,直觀呈現 (差異) 表現蛋白在各個樣本或組別中的表現量趨勢與聚類 (clustering) 關係。
  • 火山圖:整合表現變化幅度(fold change)與統計顯著性(p-value),一眼看出哪些蛋白表現量差異最大、統計上也最顯著。


在針對大腸癌 (Colorectal cancer) 的研究中,Wang 等人 (2024) 將 THP-1 單核球與不同大腸癌細胞株共同培養,觀察其蛋白表現量變化。透過熱圖 (圖一左) 可看出,同一組內部的蛋白質表達差異很小,但不同組之間存在顯著差異,證明了大腸癌細胞確實誘導了 THP-1 單核球的蛋白質表現變化。火山圖 (圖一右) 則凸顯出在腫瘤組和對照組比較之下的上調和下調蛋白質,除了讓複雜數據變得一目了然之外,也有助於後續進階分析能聚焦在特定蛋白上。


▲圖一、差異蛋白分析視覺化。左圖為熱圖,顯示同組內蛋白表現趨勢一致、組間差異明顯;右圖為火山圖,突顯在腫瘤與對照組間顯著上下調的蛋白。


➤ Rank Plot:從高到低,一覽蛋白質表現排序
除了關注顯著差異的蛋白質外,Rank plot提供另一個視角,從整體分布中挖掘出表現量特別高或低的潛在關鍵蛋白:
  • Rank plot:將所有蛋白依照豐富度 (abundance) 或表現變化幅度 (fold change) 排序,便於篩選高表現或極端差異的蛋白,亦可視覺化整體分佈趨勢。

在食道鱗狀上皮細胞癌相關的研究中,Liu等人 (2022) 便是透過rank plot (圖二) 凸顯表現量增加和減少最多的前幾名蛋白,作為挑選潛在生物標記的初步線索。
▲圖二、Rank plot,依照表現變化幅度將蛋白排序。
 
➤ Upset Plot:不同實驗條件下的交集與獨有蛋白有多少?
當比較的組別超過兩組,如何整理每組間「共有」與「獨有」的表現蛋白?這時候 Upset Plot 就派上用場了!
  • Upset Plot:透過條狀圖與點矩陣展示多組別之間的交集與獨特性,相較於凡氏圖(Venn Diagram),Upset Plot更適合多組比對。 

在Dong等人 (2023) 探討腎小球腎炎 (glomerulonephritis) 小鼠模型的研究中,為了比較五種不同處理條件下的小鼠腎臟組織,作者透過Upset Plot (圖三) 展示每一組所獨有、以及與其他組共享的差異表現蛋白數量,進一步根據共有蛋白進行 GO 與 pathway 功能分析。這樣的分析策略可以避免失焦,也有助於辨識疾病核心機制中的關鍵蛋白。
 

▲圖三、以Upset plot 呈現實驗組與對照組間的共有/獨有差異蛋白。

➤ PCA:從整體觀點看出分群趨勢
除了關注單一蛋白的差異,也可以再換個視角,透過主成分分析 (PCA) 來評估整體樣本間的變異:
  • PCA:透過降維的方式,可從高維資料中萃取最具代表性的變異方向,將樣本投影在前兩個主成分構成的平面上。若不同組別樣本在 PCA 圖上能夠清楚地分群,代表蛋白質表現具有辨識潛力,也可能成為疾病分類或預測的依據。

在Mok等人 (2024) 對於青光眼 (glaucoma) 亞型的多體學分析研究中,作者收集三種青光眼亞型患者的水晶體後房水 (Aqueous humor) 樣本,分析其中蛋白質與代謝物的變化。PCA (圖四) 結果顯示,不同亞型之間的蛋白質組成具有中度差異,其中亞型POAG和XFG能夠與對照組區分開來。


▲圖四、以PCA呈現三種疾病亞型和對照組的分群。


▌GO / KEGG:賦予蛋白「角色」與「舞台」

差異蛋白的數量可能從幾十個到幾百個,但每個蛋白會在哪些生物過程或訊息傳遞路徑上扮演重要角色呢?不妨透過 Gene Ontology (GO) 與 KEGG Pathway 分析找出這些蛋白的功能吧。
  • GO 富集分析:了解蛋白參與了哪些生物過程 (BP)、細胞組成 (CC) 或分子功能 (MF)。
  • KEGG Pathway富集分析:釐清蛋白可能參與的訊息傳遞路徑與代謝網絡。

這兩種富集分析在差異蛋白分析中可說是必備項目了!為了釐清魚鰓黏膜免疫反應對細菌感染的機制,Hu等人 (2023) 透過GO和KEGG Pathway富集分析找出差異蛋白對應的功能及參與路徑。GO結果顯示,這些差異蛋白涉及與細胞活動、生物結構與分子功能相關的基本生物過程 (圖五),而KEGG結果則反映出免疫反應如補體活化、抗原呈遞與細胞骨架調控為此研究中的關鍵路徑 (圖六)。


▲圖五、差異蛋白之GO富集分析,包含 (A) 生物過程 (biological process, BP)、(B) 細胞組成 (cellular component, CC) 和分子功能 (molecular function, MF) 三個類型。


▲圖六、KEGG Pathway 富集分析。差異蛋白於Complement and coagulation cascades和 antigen processing and presentation兩訊號路徑中的參與位置。


 ▌PPI 網絡分析:探索蛋白之間的交互關係

蛋白質往往不是單獨一個就可以發揮作用,而是會與其他蛋白形成功能模組—藉由蛋白質交互作用 (Protein-protein Interaction, PPI) 網絡分析,可以找出關鍵蛋白與其交互作用的對象,推測潛在的生物學模組或治療標靶的候選蛋白。
Santos等人 (2022) 便是透過廣為人知的STRING資料庫建構 PPI網絡 (圖七),了解腸型胃癌 (intestinal gastric cancer, IGC) 中核心蛋白質之間的交互作用,進而找出潛在的治療標靶。綜合PPI和功能富集的結果也顯示出,這些差異蛋白與細胞凋亡調節、免疫系統、嗜中性白血球去顆粒作用 (neutrophil degranulation)、RNA 代謝和染色質 DNA 結合 (chromatin DNA binding) 的富集模組有關。

▲圖七、透過STRING資料庫建構差異蛋白的PPI 網絡圖。


▌用圖表說故事,讓蛋白分析更有價值

透過合適的分析與視覺化方式,不只能從數據中觀察出樣本間的差異性,更能進一步解讀其中蘊含的生物學故事與意義。但故事背後,少不了繁瑣的資料處理與視覺化製圖流程。

面對大量數據與複雜流程,不必再單打獨鬥!圖爾思提供從視覺化到功能富集與網絡分析的一站式服務,協助您掌握蛋白質變化背後的生物學意義,並用更少的時間,講出更完整的故事。
如果您正在尋找一套完整且嚴謹的生資分析服務,歡迎聯絡我們了解更多!

Reference
 
 
 
回上一頁
聯絡我們
CONTACT US
立即前往

抱歉,為了您的瀏覽體驗及安全性,本網站不支援IE瀏覽器,請參考下方常用瀏覽器。