目前,對蛋白質功能的研究極其缺乏。大多數通過基因組測序新發現的基因編碼的蛋白質的功能是未知的,對於那些功能已知的蛋白質,其功能大多是通過同源基因功能的類比來推斷的。據預測,至少有壹半由人類基因組編碼的蛋白質具有未知的功能。因此,未來幾年,隨著至少30個物種基因組測序的完成,人們的研究重點必將轉移到蛋白質的功能上,而蛋白質組的研究可以實現這壹目標。在蛋白質組的具體應用中,蛋白質在疾病中的重要作用使得蛋白質組在人類疾病的研究中具有極其重要的價值。
該病可能僅由基因組中壹個堿基對的改變引起,如β-血紅蛋白第六位的Glu變為Val,導致鐮狀細胞性貧血。但是,對於大多數疾病來說,發病機制要復雜得多。因此,對疾病發生的分子機制的理解需要壹些方法來解決這些復雜性。蛋白質作為細胞中的活性大分子,無疑是與疾病相關的主要分子,蛋白質表達水平的變化與疾病、藥物或毒素有直接關系。因此,基於蛋白質整體水平的蛋白質組學無疑將在人類疾病研究中發揮重要作用。
現在,蛋白質組學在人類疾病中的應用已經在壹些疾病中廣泛開展,如皮膚病、癌癥和心臟病,這些研究主要集中在以下幾個方面:尋找與疾病相關的單個蛋白質,從整體上研究疾病引起的蛋白質表達或修飾的變化,利用蛋白質組尋找病原微生物引起的疾病的診斷標誌物和疫苗。下面,我們將介紹蛋白質組學的基本技術及其在這些領域的應用。
蛋白質組學研究的基礎技術
對於蛋白質組學的研究,最基本的實驗手段是利用雙向蛋白質電泳(2DE)在全基因組水平上檢測蛋白質的表達。二維凝膠電泳先用等電點聚焦分離不同等電點的蛋白質,再用SDS-PAGE分離不同分子量的蛋白質,分辨率很高。微克級的蛋白質可以很好的區分。比如微克級,有人已經從壹個蛋白質混合物中分離出高達11200種蛋白質,數量非常可觀。因此,微克級蛋白質的二維凝膠電泳經常用於初步檢測表達改變或修飾的蛋白質。然後,同樣的蛋白質混合物樣品可以用在毫克級的2DE上,這樣電泳圖譜上的每壹條多肽都可以被純化並進壹步分析,如質譜、末端或中間氨基酸序列分析等。
僅僅進行二維凝膠電泳顯然是不夠的,因為二維凝膠電泳得到的蛋白質表達的變化無法與具體的蛋白質表達變化聯系起來。然而,壹些傳統的技術如蛋白質印跡或凝集素親和印跡對這些信息沒有幫助。為了鑒定通過電泳獲得的這些蛋白質,質譜(MS)被廣泛用於蛋白質組學。對於蛋白質的鑒定,廣泛使用兩種方法,即MALDI-MS(基質輔助激光分離)和ESI-MS(電噴霧電離)。這兩種方法各有適用範圍。通常,前者對分析高分子量蛋白質更有效,而後者對檢測蛋清更敏感,蛋清往往可以達到低於Fick的水平。質譜可以用於蛋白質分析主要是因為它可以提供特定蛋白質的不同結構信息,例如可以直接確定蛋白質或多肽的分子量信息,也可以用來獲得壹些蛋白質序列信息。同時,質譜還可以通過改變多肽片段的分子量,得到壹些關於糖類型、磷酸化等翻譯後修飾的數據。因此,質譜對於蛋白質的鑒定非常重要,它的進步無疑將極大地推動蛋白質組學的研究進展。
尋找單壹的疾病相關蛋白
在疾病發生過程中,蛋白質的種類和數量往往會因疾病相關基因信息的改變而發生變化,而這些變化可以通過高分辨率二維凝膠電泳檢測出來,這是利用蛋白質組學尋找和鑒定疾病相關蛋白質的基礎。
結腸癌的發生是壹個多步驟的過程,涉及多個基因突變,包括抑癌基因的功能喪失和癌基因的激活。然而,腫瘤發生的具體機制尚不清楚。對於這樣壹種涉及多種蛋白質的疾病,人們已經開始利用蛋白質組學來分析結腸黏膜惡變後多肽的變化。與15結腸癌患者和13正常人比較,雙向凝膠電泳結果顯示分別有882個斑點和861個斑點,在這些斑點中,有壹種分子量為13kDa,等電點為5.6的蛋白質,只在腫瘤組織中特異表達。在15例癌癥樣本中,13例上調,占87%。進壹步的研究也證實,在不同程度的癌癥引起的發育異常中,這種蛋白的表達水平存在明顯的差異。雙向電泳發現的這種可能與癌癥有關的蛋白質到底是什麽?該肽經胰蛋白酶水解後,用μ-HPLC分離並測序。測序得到LGHPDTLNQ和VIEHMEDLDTNADK兩個序列,與鈣粘蛋白B的情況完全壹致,MALDI-MS進壹步分析也證實該蛋白為鈣粘蛋白B..同時,結合之前的發現,即由鈣粘蛋白B和a組成的異二聚體蛋白鈣防禦蛋白在胃腸道腫瘤患者糞便樣本中的含量有了很大的提高,鈣粘蛋白B在腫瘤組織中的高度特異性表明其在結腸癌的產生中起著重要作用。雖然蛋白質的具體功能還有待進壹步闡明,但這個例子已經證明,通過蛋白質組學尋找疾病相關蛋白質肯定是可行的。
另壹個例子是對肝細胞癌的研究。二維凝膠電泳(2-DE)已被成功用於在化學誘導的小鼠中尋找與肝癌相關的蛋白質。雙向電泳和蛋白質化學方法的聯合應用,加深了對這些癌癥相關蛋白特異性的了解。N-甲基-N-亞硝基脲誘發小鼠肝癌後,雙向電泳發現壹些表達發生變化的蛋白質。經過氨基酸序列分析,其中壹個蛋白是肝癌衍生的醛糖還原酶樣蛋白。這種蛋白質的分子量為35KDa,等電點為7.4。它是壹種在肝癌和胚胎肝中特異性表達的蛋白質。通過雙向電泳獲得這樣壹種可能與癌癥相關的蛋白質後,可以利用壹些蛋白質化學方法進壹步研究這種蛋白質與疾病的相關性。通過免疫組織化學方法發現,針對肝癌醛糖還原酶樣蛋白的抗體FR-1表明,該蛋白在化學誘導的肝癌小鼠腫瘤轉化早期和早期強表達,而在正常肝組織中不表達。這是這種蛋白質參與肝癌過程的有力證據。
對這種蛋白質的壹些研究表明,醛糖還原酶是還原酶超家族的成員之壹,它可以催化山梨醇途徑中葡萄糖轉化為山梨醇,它還在糖尿病的壹些並發癥的發生中起作用。作為壹種酶,它可以水解壹些生物異質物質,所以它也參與壹些解毒過程。公認的事實是,在肝癌發生期間,壹些解毒酶的表達水平或活性增加。對於醛糖還原酶這種具有解毒功能的蛋白質,只有雙向電泳發現的肝癌醛糖還原酶樣蛋白與肝癌有關。它首先在胚胎肝臟中表達,但不在成人肝臟中表達。當肝癌發生時,它被重新表達。因此,可以初步推斷醛糖還原酶樣蛋白與肝細胞癌發生過程中肝臟的解毒過程有關。現在,在人類肝癌中也發現了小鼠醛糖還原酶樣蛋白的同源蛋白,在人類的不同組織中也有選擇性表達。
疾病相關蛋白的整體研究
對於大多數疾病來說,疾病往往引起不止壹種蛋白質或幾種蛋白質的變化,參與疾病過程的蛋白質數量也非常多。因此,除了通過二維凝膠電泳找到與疾病相關的單個蛋白質外,通過蛋白質組在整體水平上研究表達發生變化的蛋白質也非常重要。目前在蛋白質全水平的雙向凝膠電泳研究中,擴張型心肌病(DCM)是壹個很好的例子。
擴張型心肌病是壹種嚴重的心臟病。這種疾病的發病機制和涉及的分子尚不清楚,如此復雜的疾病不可能僅由壹種致病機制引起。因此,從整體蛋白質組水平來研究此類疾病是極其必要的。此外,與其他組織相比,主要由心肌細胞組成的心臟是壹種相對均質的組織,這也為利用二維凝膠電泳研究蛋白質的組提供了良好的基礎。DCM蛋白質組的研究始於20世紀90年代初。目前,心肌雙向凝膠電泳數據庫已經建立。雖然世界上各實驗室之間的數據存在差異,如樣品制備不同、等電聚焦條件不同、凝膠大小不同等,但這些數據的比較證明,在大多數情況下,不同蛋白質的位置是相對穩定的,可以進行大範圍的比較。
在Knecht等人的研究中,獲得了約3300個心肌蛋白點的高分辨率雙向電泳結果,通過氨基酸分析、N端和中間埃德曼降解和MALDI-MS鑒定了150個蛋白,對比數百例正常和擴張型心肌病患者的2-DE結果,發現兩者的蛋白帶具有可比性。除了疾病相關參數不同可能導致的非重復斑點的數量和強度變化,如病情程度、用藥情況、患者年齡等,患者與正常人之間有25種蛋白質有統計學意義。這些是DCM相關蛋白。這壹結果是在數百個樣本的大規模研究基礎上得出的,只有大規模研究才能體現這壹結果在實際應用前景中的價值。對於這幾十種疾病相關蛋白,我們可以用壹些其他的方法,比如免疫組織化學、酶活性測定等。,以進壹步識別它們並確認它們與疾病的相關性以及它們在疾病中的作用。這些工作都是基於蛋白質組的研究。顯然,對DCM患者和正常對照的數百個樣本進行大規模的疾病相關蛋白整體研究,無疑是最基礎、最有效的。
病原微生物的蛋白質組學分析。
近年來,對傳染病的研究變得比以前更重要了。壹些新的傳染性病原體的出現,如伯氏疏螺旋體、艾滋病病毒、埃博拉病毒等。,增加了壹些原本以為已經得到控制的疾病,如肺結核、多重耐藥鏈球菌感染等。因此,用蛋白質組學來分析強毒微生物和病毒是非常必要的,可以用來發現和研究毒力因子、抗原、疫苗等,對疾病的診斷、治療和預防都是極其重要的。目前已完成18種微生物的基因組測序,60多種微生物的基因組測序正在進行中。這些基因序列的信息和比真核組織少得多的基因數量為蛋白質組的研究提供了良好的基礎。
疏螺旋體屬的伯氏疏螺旋體是人類萊姆病的主要致病因素。起初,這種疾病的癥狀往往表現為壹些環狀紅斑樣皮疹和流感樣癥狀,然後它會引起壹些神經並發癥和關節炎。目前對該病的診斷主要是通過判斷臨床癥狀來確診,輔以ELISA、western blot等血清學實驗。因為這些實驗具有不同程度的敏感性和特異性,所以診斷是不規範的。利用蛋白質組學的研究,提供壹些新的、更標準的診斷標誌物,顯得尤為必要。
伯氏疏螺旋體的染色體上有853個基因,其11質粒有額外的430個基因。其二維凝膠電泳圖譜約有300個點,從中可以發現免疫相關抗體等蛋白質。在伯氏疏螺旋體的銀染2DE凝膠上編號為217個斑點後,通過與來自兔的多克隆抗體的免疫雜交來鑒定凝膠上壹些抗原的位置,如外表面蛋白A(OspA)、OspB、OspC、p83/100、p39、鞭毛蛋白p41等。除了p83/100,所有的抗原都存在於2D圖上的壹個以上的點上。具有不同癥狀的萊姆病疏螺旋體病患者和疏螺旋體的血清的2DE圖譜用於印跡分析。發現10例有紅斑遊走癥狀的患者血清中分別含有60和88種抗原的IgM抗體和IgG抗體,而關節炎患者血清中含有15種抗原的IgM抗體和76種不同抗原的IgG抗體。晚期神經螺旋體病患者的血清中含有33種IgM抗體和76種IgG抗體,但這三種不同疾病患者的血清中均含有針對這些抗原的抗體,如OspA、OspB、OspC、鞭毛蛋白、p83/100、p39等。,這也是在最初的血清學實驗中用於診斷的標記。蛋白質組的結果驗證了原來診斷的合理性,同時2DE的結果也發現了壹些以前沒有發現的抗原,只是壹些新的潛在的診斷標誌物。更多診斷標誌物的發現對診斷的規範化和準確性有很大幫助。
弓形蟲是由原蟲弓形蟲寄生感染引起的。全世界約有30%的人攜帶這種寄生蟲,而在歐洲,弓形蟲病是最常見的傳染病之壹,因此這種疾病的危害相當高。在健康人群中,寄生蟲感染通常無癥狀或極其輕微,但如果在懷孕期間感染,寄生蟲會通過胎盤導致胎兒死亡。隨著懷孕時間的增加,寄生蟲滲透的可能性會增加。因此,確定感染時間非常重要。另壹方面,懷孕不同階段感染的後果也不同。在妊娠早期,器官形成過程中的感染可能是致命的,而在妊娠後期,胎兒感染往往會導致視網膜色素異常等壹些並發癥。如果在懷孕期間感染的婦女得到充分治療,胎兒感染的可能性及其後果的嚴重性將大大降低。因此,及時診斷和準確判斷感染時間對弓形蟲病的治療至關重要。
但事實上,90%以上的孕婦初次感染不能及時發現。目前診斷主要依靠血清學方法和PCR方法,但對於壹些非免疫和妊娠患者,血清學方法檢測抗體顯然是不夠的,在無免疫反應的人群中常出現潛伏感染。例如,在艾滋病患者中,弓形蟲是腦部病變和死亡的主要原因。從這些可以看出,疾病的有效診斷對於有效治療是非常關鍵的。同樣,蛋白質組水平的研究為這壹進展提供了非常有力的方法。我們可以利用不同感染狀況患者的血清和弓形蟲的二維電泳圖譜進行免疫印跡,尋找與感染相關的抗原作為診斷標記。這些不同的血清包括:患有急性弓形蟲病的孕婦的血清,患有急性弓形蟲病的非妊娠患者的血清,以及尚未發生潛伏弓形蟲病的患者的血清。結果表明,2DE圖譜上的9個點可與感染血清中任何類型的免疫球蛋白發生反應,且這種反應與感染狀態和發病率無關,因此這9個點可作為弓形蟲感染的標記。此外,七穴和抗體反應與抗體類型或發生率有關,可用於區分潛伏期、急性期等不同的病情,也可作為進壹步判斷感染狀態的診斷標記。
總結
二維凝膠電泳就像壹個分子顯微鏡,把復雜的蛋白質混合物分離出來,進壹步對比疾病和對照,可以發現壹些疾病相關的蛋白質。目前,蛋白質組學應用最廣泛的領域是通過比較疾病和對照的2DE條帶來尋找單壹的疾病相關蛋白。結腸癌鈣粘蛋白B的上調和小鼠肝癌醛糖還原酶樣蛋白的再表達就是兩個典型的例子。這些蛋白質與疾病之間的關系可以通過免疫組織化學和其他方法進壹步確定。另壹方面,利用蛋白質組進行整體水平的研究也是必不可少的。例如,對擴張型心肌病的研究顯示,患者和對照組之間有25種蛋白質存在顯著差異,包括3300種蛋白質的人類心肌二維凝膠電泳數據庫也已建立。對於研究的整體水平來說,規模越大,使用的樣本越多,對分子機制的研究可能就越深入,所以國際合作非常重要。蛋白質組學的另壹個應用領域是尋找病原微生物的診斷蛋白,如伯氏疏螺旋體疏螺旋體疏螺旋體疏螺旋體疏螺旋體伯氏疏螺旋體伯氏疏螺旋體伯氏疏螺旋體伯氏疏螺旋體伯氏疏螺旋體伯氏疏螺旋體伯氏弓形蟲等。從蛋白質組學中獲得的診斷標記甚至可以用於區分不同的疾病階段,這為開發有效的診斷和檢測提供了基礎。蛋白質組學的研究為我們研究蛋白質功能和人類疾病開辟了壹個新的領域。雖然它仍處於起步階段,許多技術需要完善和發展,但其潛力不可低估。未來,蛋白質組在人類疾病中的應用將更加廣泛和深入。