<track id="pfjxr"></track>

    <track id="pfjxr"></track>

      <noframes id="pfjxr">
      <big id="pfjxr"></big>

            <span id="pfjxr"></span>
            <menuitem id="pfjxr"><span id="pfjxr"></span></menuitem><address id="pfjxr"></address>

            生物行

            當前位置: 主頁 > 神經科學 > 研究進展 >

            六國科學家聯合發起“未充分研究蛋白質計劃”

            時間:2022-08-20 21:30來源:fanpusci.blog.caixin.com 作者:泉水 點擊:
            蛋白質是一類重要的生命大分子,參與組成了機體所有的重要部分。它是生命的物質基礎,也是生命活動的主要承擔者,可以毫不夸張地說,沒有蛋白質就沒有生命。 人們針對蛋白質的研究從

            蛋白質是一類重要的生命大分子,參與組成了機體所有的重要部分。它是生命的物質基礎,也是生命活動的主要承擔者,可以毫不夸張地說,沒有蛋白質就沒有生命。

            人們針對蛋白質的研究從未間斷過,但同為蛋白質,不同的種類所受的關注度卻是天差地別。到目前為止,大多數蛋白質的研究都集中在有限的一些蛋白質上,結果是熱門的蛋白質正在越來越被人們所熟知,冷門的蛋白質的生物學功能,人們仍然知之甚少。

            長此以往,已知功能蛋白質和未表征蛋白質之間的巨大“鴻溝”便開始慢慢顯現了。因此,重視對未表征蛋白質的研究,縮小不同種類蛋白質之間的認知差距,解決注釋非均一性問題,可以說是箭在弦上,勢在必行。

             

            今年,Georg Kustatscher等六國科學家聯合發起了一項名為“未充分研究的蛋白質計劃”的調查,并分別在Nature MethodsNature Biotechnology上發表了兩篇重要文章,呼吁學界通過系統地關聯未表征的蛋白質和已知功能的蛋白質,縮小兩者之間的注釋差距,從而為詳細的機制研究奠定基礎。

            這項計劃將如何開展?又將帶給我們多少未知的驚喜?本文在不改變原文意思的基礎上做了編譯。希望更多的研究人員和科學家們可以響應這些呼吁,解密那些未知的未知和“暗物質”蛋白質,擴大人類對生物大分子認知的邊界。

             

            編譯 | 紀十

            責編 | 李曉韋

             

            1、蛋白質研究現狀

            科學家們對于不同蛋白質的關注天差地別,人類蛋白質組中最受歡迎的蛋白質是p53,平均而言,每天有兩篇以p53為研究對象的文獻發表。

            與此同時,數以千計其他人類蛋白質的生物學功能尚未得到研究。在人類蛋白質組功能表征研究中,95%的發表作品都在關注5000種已得到充分研究的人類蛋白質。人類基因組的測序被視作是減少這種偏見的關鍵,但即使在基因組序列公開十年后,75%的發表作品仍然只關注基因組繪制之前已被研究的基因。

            事實上,自人類基因組序列發布以來,這種注釋的非均一性(annotation inequality)幾乎翻了一番。注釋非均一性阻礙了生物醫學的進步,基因疾病之間的關聯機制研究通常集中在廣為人知的蛋白質上(圖1),與此同時,許多與疾病相關的未表征的蛋白質沒有經過功能研究。

            例如,許多參與罕見疾?。涌偲饋聿⒉缓币姡┑牡鞍踪|的功能,我們對它們知之甚少。此外,神經發育障礙和癌癥等常見疾病是由不同基因中許多罕見的遺傳變異共同引起的。

            值得注意的是,截至2015年,在對一個人類細胞系增殖至關重要的1,878個基因中,有330個(18%)仍未被表征。這種偏差延伸到了目前預計可做藥物研究的約3,000種蛋白質:目前只有5-10%的潛在靶標蛋白質可作為獲FDA(美國食品與藥品監督管理局)批準藥物的作用靶點。

            圖1 蛋白質注釋非均一性阻礙了生物醫學的進步。以前的文獻、數據和工具的數量決定了蛋白質研究問題是否容易提出和解決,這深化了注釋偏差,也使得未充分研究蛋白質這一問題遲遲得不到解決。

             

            2、蛋白質注釋非均一性的起源

            蛋白質注釋偏差的原因是多方面的,有些是實際操作的原因,例如,抗體、質?;蚓拇蛟斓膮⒖紨祿葘嶒灩ぞ哂辛Φ赝苿恿巳藗冞x擇研究那些已被充分研究的蛋白質。關于蛋白質的文獻數量也與其基本的生物學和生化特性有關,例如蛋白質大小、豐度、疏水性及其基因對突變的敏感性。事實上,迄今為止,在19,733個人類蛋白質編碼基因中,有1,899個(9.6%)缺乏蛋白質組學技術的可靠支持,其中一些可能構成基因組注釋錯誤。

            此外,未被充分研究的蛋白質的一個顯著共同特征是分子量極小:SwissProt中注釋最少的蛋白質中有40%小于15 kDa。此外,目前被人所知的未充分研究的“小蛋白質”庫可能只是冰山一角,因為我們才剛剛開始發現“替代蛋白質”群,這些蛋白質的基因以前被認為是非編碼區域。蛋白質注釋非均一性的其他成因可能更反映了研究系統的偏見。

            例如,人們通常仍會認為有眾多研究的蛋白質在功能上更重要??茖W家通常更愿意詳細探索已經被研究過的問題,除了資金申請和同行評審系統需要規避風險外,投入大的研究領域還可以增加被引,增加在高影響力期刊發表文章的機會。支持現有范式而不是新思想的范式也減緩了整體科學進步。實驗室研究的一些條件限制也是同樣重要的原因。

            矛盾的是,這些限制本意可能是希望通過實驗室條件的標準化使研究產生更具可重復性的結果。例如,在標準的實驗室培養條件下,約20%的釀酒酵母基因缺失會產生致死表型。然而,當培養空間擴大時,97%的基因對于在至少一個條件下的最佳生長至關重要。對于具有特殊細胞類型的多細胞生物體,這個問題更復雜;一些組織或細胞類型比其他組織或細胞類型的研究多得多。

            最后,蛋白質注釋偏差反映出人們更關注假設驅動而不是問題驅動的研究,而對非表征蛋白質的機制分子功能提出假設十分困難。哲學家弗朗西斯·培根(Francis Bacon)曾被認為是“科學方法之父”,他認為實驗不應該由假設驅動,以規避觀察者的偏見。因此有人提出,嚴格的數據驅動方法可以幫助減少蛋白質注釋非均一性。

             

            3、加速針對未充分研究蛋白質的藥物發現

            從藥物發現的角度來看,那些提高我們對蛋白質-小分子相互作用的理解的舉措,如結構基因組學聯盟、酶功能計劃、闡明可藥用基因組計劃和開放靶點等項目,在未充分研究的蛋白質的表征研究中正取得根本性進展。

            在這種情況下,“功能表征”通常是指揭示與藥物開發特別相關的蛋白質的分子特性,例如其結構、配體、被化學探針的可抑制性以及與疾病的關聯。重點是藥理學上方便研究的蛋白質家族,例如離子通道、G蛋白偶聯受體和激酶等。但隨著新方法(如PROTACs)的發展,可藥用蛋白質的定義正在隨著時間的推移而發展。

             

            4、怎么用功能蛋白質組學解決注釋非均一性問題?

            需要區別兩種不同類型的蛋白質注釋工作:原創研究和“關聯”法。對新型生物學功能的原創研究是必不可少的,其涉及許多詳細的機制研究,耗時且花費巨大。對于研究人員來說,要致力于這樣的工作,所研究的蛋白質必須具有一定的基礎注釋水平,否則,其功能假設就缺乏基礎。而“功能關聯”的注釋可以通過知識轉移提供所缺乏的基礎,從而將以前未表征的蛋白質與經過充分研究的蛋白質及其生物學功能聯系起來。

            、蛋白質組學方法特別適合于在大規模范圍內揭示功能關聯。這包括鑒定蛋白質-蛋白質相互作用的技術,識別哪些蛋白質共同調控的方法以及揭示哪些蛋白質共享亞細胞空間的方法(具體見圖2)。例如,在基于抗體的蛋白質組學鑒定出數百種額外的中心體蛋白之前,人們認為大多數中心體蛋白已被鑒定出來。

            雖然基于質譜的蛋白質組學尚未達到基因組方法的基因覆蓋率,但在研究(蛋白質編碼)基因的功能時,直接觀察蛋白質可能尤其有用。例如,比起mRNA共表達,蛋白質共表達在捕獲功能關系時的作用尤其顯著?;诘鞍踪|的分析還具有區分蛋白質形式的潛力,即被表達蛋白質的單個分子形式,其中剪接和翻譯后修飾等顯著增加了蛋白質組的功能多樣性。蛋白質形式表征可能需要使用自上而下或自中而下的蛋白質組學方法。蛋白質組學的通量正在迅速增加,已經有方法可以每天在單臺質譜儀上記錄數百個蛋白質組。

            然而,蛋白質注釋非均一性不太可能完全通過大規模方法解決。努力共同解決蛋白質注釋偏差的第一步可能是系統地為進行靶向相關實驗的個體研究人員提供必要的最小數據基礎,比如使用質譜法大規模鑒定蛋白質-蛋白質和蛋白質-蛋白質復合物相互作用的BioPlex和hu.MAP項目;使用抗體將人類蛋白質歸屬至不同的組織和亞細胞位置的人類蛋白質圖譜(Human Protein Atlas);以及旨在通過蛋白質組學表征50種未充分研究蛋白質的neXt-CP50項目等。圖2. 揭示不同蛋白質之間關聯的蛋白質組學方法:質譜(MS)和基于抗體的方法,通過識別不同蛋白質之間的相互作用(PPI)來實現注釋轉移,在它們鏈接性質、可擴展性和偏差上有所不同,每種方法都有優勢和劣勢。以上是近年來的關鍵技術詳單。值得注意的是,有各種非質譜的方法也能揭示不同蛋白質之間的關聯。包括二元分析法,如Y2H、LUMIER、遺傳相互作用篩選和代謝特征分析等。

             

            5、如何增加功能蛋白質組學在機制研究中的作用?

            生物學家可以通過各種強有力且便捷的資源來查看分子網絡,包括IntAct、BioGRID、NDEx和STRING。盡管這些資源很容易獲取,但注釋偏差卻在不斷加劇,原因可能很多:也許細胞生物學家不了解這些注釋門戶網站,也可能是缺乏信任,或者注釋不足和對不同注釋的整合不足等。

            細胞生物學家可能會對依賴大規模項目的數據仍存疑慮,事實上,以統計學方式處理誤差是大規模方法的獨特優勢。雖然誤差無法避免,但其嚴重程度是了解結果可靠性的關鍵參數。功能性蛋白質組學技術中已經確定計算錯誤發現率(FDR)的一個例子是交聯質譜法。同樣,所有質譜法蛋白質鑒定的常規計算方法也需要計算FDR。此外,空間蛋白質組學中的統計框架也正在開發,以期將蛋白質分配到亞細胞區室。

            除了擴大可用的大規模數據量外,無疑還需要開發新的工具和技術,填補目前方法留下的系統性空白。新興功能蛋白質組學技術有交聯質譜法、共聚合蛋白質組學和研究動態亞細胞區室的方法?,F在,預測蛋白質結構取得了巨大成功,可能進一步改善基于結構的功能預測,尤其是在預測的結構可以被交聯質譜法等實驗證實時。這些技術和其他細胞內技術特別值得關注,因為許多蛋白質需要折疊或輔助因子或翻譯后修飾的協助才能正常運作。此外,研究單細胞的蛋白質組技術正在日益成熟,該技術可以確定細胞間的異質性。

            最后一個關鍵挑戰是跨維度(時間和空間)整合不同類型的數據,這將最大限度地發揮不同類型組學數據之間的協同作用。比如人類蛋白質圖譜和BioPlex數據的整合,表明了細胞層級結構的生成可以揭示許多新的細胞系統,而這些系統無法通過單獨任何一個數據集檢測到。這樣的計算工具也可以通過提供數據驅動的假設來加速科學發展,也就是說,研究人員有望可以將他們的數據與蛋白質組學大數據聯系起來。即使一個蛋白質的功能得到了很好的注釋,也有越來越多的證據表明,一些蛋白質有能力執行其他不相關的功能,在文獻中被稱為“兼職”。由于研究人員假設過“一個蛋白只有一個功能”,因此人們沒有為大多數蛋白尋找其它功能。對功能蛋白質組進行全系統梳理的另一個好處是,能提供充分研究的蛋白質的其它功能注釋,并更好地了解蛋白質能夠做哪些“兼職”。

             

            6、如何量化功能表征的進度?

            如果要制定出解決蛋白質注釋非均一性的策略,并對其進行優化和評估,就需要保證信息可靠且足夠。評估功能特征絕非易事,很大程度上是因為這個術語本身就有不同的含義。“蛋白質功能”可以指蛋白質廣義上的生物學目的,比如它與哪種表型相關,或者它屬于哪種代謝途徑,也可以指如何理解蛋白質在分子水平中實現這些功能的結構和機制,例如酶的機制等。

            確定蛋白質注釋水平的方法已有很多,包括基于文本挖掘的文獻分數, Uniprot注解得分,GO覆蓋率的評估,以及根據蛋白質作為藥物靶點的開發情況對其進行分類的系統。每一個指標都捕捉到或強調了現有注釋中略微不同的方面,并不區分原始的表征和功能關聯。

            然而,為了系統地評估一個注釋轉移系統,有必要對其進行充分的量化研究以避免麥納馬拉謬誤(根據一個單一的、容易測量的目標變量而不考慮更大范圍和更難測量的因素來評估一個復雜目標的進展)。

             

            7、如何避免以偏見換偏見?

            我們認為,蛋白質組是注釋基因功能的有力工具,但蛋白質組學方法也容易受到生物化學偏見的影響,例如來自蛋白質豐度和溶解度的影響。因此,為了系統地減少全基因組注釋的偏差,可能需要單獨優化多個功能蛋白質組學方法,并將其結果整合到一起。我們還可以將蛋白質組學數據與其他組學數據進行整合。例如,代謝組學可以捕捉到一個互補的功能譜。請注意,將蛋白質組學與遺傳學、功能遺傳學或代謝組學結合起來,可以大大提升表型預測效率。

            然而,無論采取何種方法,必須消除標準實驗室的限制性因素。最近的多生物體蛋白質組學調查表明,通過比較蛋白質組學,可能會有更多的蛋白質會得到表征,因為大量蛋白質功能在進化過程中得以保留,以及保留的蛋白質在不同生物體中有不同表現。許多組學技術結合基因組編輯可以直接應用于人類細胞的研究,這引發了人們擔憂非人類生物體研究經費可能下降。盡管詳細的統計數據表明,這些擔憂目前也許并無根據。對廣泛多樣的生物進行研究,不僅讓我們發現了青霉素、GFP和CRISPR/Cas9,而且還可能幫助我們捕捉了人類蛋白質組的功能譜。

             

            8、“未充分研究蛋白質”計劃

            現在正是減少人類基因組和蛋白質組的注釋非均一性的時候(圖4)。“未充分研究的蛋白質計劃”將包括各種不同的數據生成方法,開發整合框架,并通過適當的平臺向研究人員提供注釋。該項目不僅要解決技術問題,還要找到基因功能缺失的生物醫學原因,如生長條件定義不準確、單一時間點研究,以及對于極少數遺傳變異性低的實驗室模型過度關注。蛋白質功能擴展研究也可能促進功能蛋白質組學的方法學發展,并可能將其延伸到其它物種。

            第一步,必須明確定義目標。如果功能蛋白質組學的作用是推動對未充分表征蛋白質的機制研究,那么科學家們開始此類工作所需的最基本信息是什么?這個問題只能由在分子和機制方面詳細闡明單個蛋白質在細胞中的功能的科學家才能回答。最終,實驗室科學家和審核者的主觀判斷,決定了哪些蛋白質應該被詳細研究。

            為了解這些意見,我們最近發起了一項調查(https://understudiedproteins.org/survey),科研工作者可點擊文末“閱讀原文”,填寫調查問卷。
            圖3“未充分研究的蛋白質計劃”調查截圖 (歡迎各位科研工作者們點擊文末“閱讀原文”,進入頁面后點擊“Take Survey”參與調查)

             

            第二步,必須建立一個由有志于該領域的科學家組成的團隊。該計劃由惠康信托基金(Wellcome Trust)支持,并會在即將舉行的會議(https://understudiedproteins.org/conference)上啟動。會議將討論上述調查的結果,對“未充分研究蛋白質”計劃目標的影響,以及如何監測這些目標的進展。這將助力開放式討論,如,哪些技術或發展能夠系統地釋放目前生物醫學研究中未表征的蛋白質的潛力?從而促進領域內更多發展。

            圖4. “未充分研究蛋白質”計劃的路線圖。調查將有助于確定該計劃的挑戰和目標,研討會將匯集來自大規模數據界的專家,建立涵蓋六個行動領域的計劃框架。最后,多個實驗室將合作通過實驗解決未充分研究蛋白質的問題。

             

            附:“未充分研究的蛋白質計劃”發起者及其科研單位:

            • Georg KustatscherUniversity of Edinburgh, Edinburgh, UK
            • Tom CollinsWellcome Trust, London, UK
            • Anne-Claude GingrasUniversity of Toronto, Toronto, Ontario, Canada
            • Tiannan GuoWestlake University, Hangzhou, China
            • Henning HermjakobEMBL-EBI, Cambridge, UK
            • Trey IdekerUniversity of California San Diego, La Jolla, CA, USA
            • Kathryn S. LilleyUniversity of Cambridge, Cambridge, UK
            • Emma LundbergKTH-Royal Institute of Technology, Stockholm, Sweden
            • Edward M. Marcotte: University of Texas at Austin, Austin, TX, USA
            • Markus RalserCharité University Medicine, Berlin, Germany; 
            • Juri RappsilberTechnische Universität Berlin, Berlin, Germany  

             

            參考文獻

            1. Kustatscher, G., Collins, T., Gingras, AC. et al. An open invitation to the Understudied Proteins Initiative. Nat Biotechnol (2022). https://doi.org/10.1038/s41587-022-01316-z2. Kustatscher, G., Collins, T., Gingras, AC. et al. Understudied proteins: opportunities and challenges for functional proteomics. Nat Methods (2022). https://doi.org/10.1038/s41592-022-01454-x

            (責任編輯:泉水)
            織夢二維碼生成器
            頂一下
            (0)
            0%
            踩一下
            (0)
            0%
            ------分隔線----------------------------
            發表評論
            請自覺遵守互聯網相關的政策法規,嚴禁發布色情、暴力、反動的言論。
            評價:
            表情:
            用戶名: 驗證碼:點擊我更換圖片
            特別推薦
            推薦內容
            日韩欧美成人免费综合一区|王者荣耀エロワンピ|亚洲三级片无码在线免费观看网站|一区二区三区四区日韩在线看片
            <track id="pfjxr"></track>

              <track id="pfjxr"></track>

                <noframes id="pfjxr">
                <big id="pfjxr"></big>

                      <span id="pfjxr"></span>
                      <menuitem id="pfjxr"><span id="pfjxr"></span></menuitem><address id="pfjxr"></address>