華西醫(yī)學(xué)期刊出版社
標(biāo)題
  • 標(biāo)題
  • 作者
  • 關(guān)鍵詞
  • 摘要
高級搜索

四川大學(xué)華西醫(yī)院華西-華盛頓線粒體與代謝研究中心:采用“組熵”技術(shù)開展血液代謝組復(fù)雜數(shù)據(jù)標(biāo)準(zhǔn)化方法的評估

四川大學(xué)華西醫(yī)院華西-華盛頓線粒體與代謝研究中心下屬的蛋白組-代謝組團(tuán)隊(duì)于2018年9月在Analytical Chemistry發(fā)表文章“MetaboGroupS: A Group Entropy-Based Web Platform for Evaluating Normalization Methods in Blood Metabolomics Data from Maintenance Hemodialysis Patients”(影響因子6.35)(長按下方二維碼即可閱讀原文)。


代謝組學(xué)是通過分析生命過程中一系列小分子代謝物的變化來研究和闡述生命現(xiàn)象的一門學(xué)科。隨著檢測設(shè)備和方法學(xué)的進(jìn)步,代謝組學(xué)在醫(yī)學(xué)和生命科學(xué)研究領(lǐng)域發(fā)揮著越來越大的作用,特別最近幾年在精準(zhǔn)醫(yī)學(xué)、遺傳與分子生物學(xué)、營養(yǎng)學(xué)、藥學(xué)等領(lǐng)域代謝組學(xué)相關(guān)文獻(xiàn)呈現(xiàn)爆發(fā)式增長,其重要性已不容質(zhì)疑。




隨著代謝組學(xué)在生物醫(yī)學(xué)中的應(yīng)用,組學(xué)數(shù)據(jù)的解析已經(jīng)成為不可或缺的重要環(huán)節(jié)。解析代謝組學(xué)數(shù)據(jù)絕不簡單,這是因?yàn)椋?. 生命體代謝是一個復(fù)雜過程,由此產(chǎn)生多種多樣的代謝物;2. 基于高效液相色譜-串連質(zhì)譜的方法對代謝物進(jìn)行定性和定量的分析過程中,儀器本身會帶來系統(tǒng)誤差;3. 實(shí)驗(yàn)人員進(jìn)行多個樣本處理、或不同實(shí)驗(yàn)人員分批處理樣本時,不可避免的引入人為誤差。這些誤差最終導(dǎo)致代謝物的定量數(shù)據(jù)具有一定不準(zhǔn)確性或者偏移,因此需要對該類數(shù)據(jù)進(jìn)行校正。


為了解決上述問題,學(xué)者們提出各種探索性方法以處理代謝數(shù)據(jù)的標(biāo)準(zhǔn)化問題。迄今為止,相關(guān)標(biāo)準(zhǔn)化處理方法已不下30種,給數(shù)據(jù)分析人員帶來了困惑:到底選擇哪種數(shù)據(jù)標(biāo)準(zhǔn)化方法呢?或者哪種標(biāo)準(zhǔn)化方法比較適合我目前的數(shù)據(jù)呢?這就需要建立一類評價體系以評估標(biāo)準(zhǔn)化方法,并且最好能有一個直接運(yùn)算的工具,幫助數(shù)據(jù)分析人員方便快速地選擇適合自己數(shù)據(jù)的標(biāo)準(zhǔn)化方法。


有鑒于此,我們首次提出“組熵”(Group Entropy)概念,計(jì)算樣本組間和組內(nèi)的熵值。我們的科學(xué)依據(jù)是:理想狀態(tài)下,如果該標(biāo)準(zhǔn)化方法合適,則標(biāo)準(zhǔn)化后的數(shù)據(jù)在同一組樣本的組內(nèi)熵值應(yīng)該最?。ㄍ唤M樣本之內(nèi)較相似)、在不同組樣本的組間熵值應(yīng)該最大(不同組樣本之間差異大)。利用這個方法,就可實(shí)現(xiàn)每一種數(shù)據(jù)標(biāo)準(zhǔn)化方法的評價。為了便于大家使用,我們進(jìn)一步編寫了在線軟件并取名“MetaboGroupS”(軟件鏈接:https://omicstools.shinyapps.io/MetaboGroupSapp/)(該軟件是免費(fèi)的,并且免登陸,歡迎大家自由訪問使用)。


整個軟件的工作流程如圖1所示:



圖1 MetaboGroupS的工作流程



借助質(zhì)譜技術(shù),我們可以得到代謝物的定性和定量信息,然后將對應(yīng)的定量信息直接導(dǎo)入該軟件,接下來點(diǎn)幾次按鈕,該軟件就可直接計(jì)算出每一種標(biāo)準(zhǔn)化方法下的數(shù)值,并且畫出對應(yīng)的主成分得分圖,我們使用了華西醫(yī)院腎內(nèi)科腎性貧血促紅素抵抗患者血漿樣本的代謝組學(xué)數(shù)據(jù)進(jìn)行分析,結(jié)果展示如圖2所示:



圖2 不同標(biāo)準(zhǔn)化方法處理數(shù)據(jù)后的PCA結(jié)果



通過上述得分圖,我們大體上可以直觀了解哪種數(shù)據(jù)標(biāo)準(zhǔn)化方法可能更適合我們自己的數(shù)據(jù)。接下來,該軟件繼續(xù)計(jì)算對應(yīng)的組內(nèi)和組間的熵值,并且排序畫出對應(yīng)圖形結(jié)果(圖3):



圖3 使用MetaboGroupS對不同標(biāo)準(zhǔn)化方法處理后的數(shù)據(jù)計(jì)算所獲得的熵值



從上述結(jié)果我們可以得到所需的結(jié)論:哪一種標(biāo)準(zhǔn)化方法下的熵值最小。


作者在此需要提醒使用者:1. 本軟件目前只整合了常用的7種標(biāo)準(zhǔn)化方法,其他方法會有何樣結(jié)果尚不清楚;2. 這一基于“組熵”的評價體系,最后只是給大家一個推薦的方法,是否這個方法一定百分百就是最好的,這個尚需斟酌。


專家點(diǎn)評


程驚秋教授:基因組學(xué)、蛋白組學(xué)、代謝組學(xué)方法技術(shù)的長足進(jìn)步,為臨床疾病發(fā)生發(fā)展深入研究和精準(zhǔn)診治提供了前景廣闊的應(yīng)用手段?;谫|(zhì)譜技術(shù)的新型儀器設(shè)備不斷推出,讓研究者更加便捷、迅速、精確地獲取臨床樣本的組學(xué)數(shù)據(jù),而這些“天量”疾病相關(guān)數(shù)據(jù)的進(jìn)一步處理、共享、解析,已然成為嚴(yán)重瓶頸,是未來的重要主攻方向。


華西醫(yī)院的組學(xué)平臺由中青年專家們跨學(xué)科合作而建立,意在將質(zhì)譜技術(shù)、計(jì)算技術(shù)引入臨床疾病的深入研究和精準(zhǔn)診治。該論文被一份B級期刊迅速采用,不因作者深厚的學(xué)術(shù)積累,而因他們新穎的研究思考——“組熵”概念的提出及其方法技術(shù)體系的建立,為數(shù)據(jù)處理方法的評估,提供了立論上有理有據(jù)的科學(xué)假設(shè)、實(shí)踐中可及可用的技術(shù)手段。對我院臨床疾病研究而言,該技術(shù)至少可提供目前雖非最優(yōu)、但為最好的方法學(xué)選擇。相信該項(xiàng)研究能夠啟發(fā)更多的團(tuán)隊(duì)開展探索,帶來更優(yōu)的方法技術(shù)。



程驚秋,博士,教授。西南大學(xué)獲學(xué)士、碩士、博士學(xué)位。1992年獲國務(wù)院政府特殊津貼,1993年破格晉升教授,1996年國務(wù)院學(xué)位辦批準(zhǔn)為博士生導(dǎo)師。1994年作為教育部高訪學(xué)者訪學(xué)美國Duquesne大學(xué),1995年訪問美國Carnegie Mellon大學(xué)。1997年回國,任職四川大學(xué)華西醫(yī)院衛(wèi)生健康委重點(diǎn)實(shí)驗(yàn)室和再生醫(yī)學(xué)研究中心教授、博士生導(dǎo)師;現(xiàn)為四川大學(xué)二級教授、四川省學(xué)術(shù)技術(shù)帶頭人。2001年1月~2017年9月?lián)稳A西醫(yī)院科研副院長,目前擔(dān)任華西-華盛頓線粒體與代謝組研究中心中方主任、四川省轉(zhuǎn)化醫(yī)學(xué)國際合作研究基地主任、華西醫(yī)院系統(tǒng)遺傳研究院榮譽(yù)院長。負(fù)責(zé)/參加國家科技部973/863項(xiàng)目、國家自然科學(xué)基金重點(diǎn)/面上課題20余項(xiàng);在SCI收錄期刊上發(fā)表論文150余篇。


專家點(diǎn)評


沈百榮教授:鑒于代謝組和蛋白質(zhì)組數(shù)據(jù)的復(fù)雜性,在對原始譜圖數(shù)據(jù)的解讀、搜庫結(jié)果數(shù)據(jù)的質(zhì)控和評價以及功能分析等方面面臨著諸多挑戰(zhàn)。為了解決這類問題,該領(lǐng)域的科研工作者提出了不少對策和方法,對數(shù)據(jù)質(zhì)量的標(biāo)準(zhǔn)化和評價是數(shù)據(jù)前處理中重要的步驟。目前已經(jīng)有多種方法報(bào)道,如:總強(qiáng)度標(biāo)準(zhǔn)化、正態(tài)標(biāo)準(zhǔn)化、方差穩(wěn)定標(biāo)準(zhǔn)化、支持向量機(jī)回歸標(biāo)準(zhǔn)化等。然而針對不同的數(shù)據(jù),怎樣去選擇合適的方法?這依然是一個棘手的問題。


針對這個問題,本文作者創(chuàng)新性地提出了一種“組熵”的評價算法,用于有效地幫助研究者選擇合適的標(biāo)準(zhǔn)化方法并給予評價,這一算法的亮點(diǎn)有:


(1)作者對物理學(xué)中“熵值”的概念進(jìn)行創(chuàng)新應(yīng)用,求得樣本組內(nèi)和組間的熵值,然后再對各個標(biāo)準(zhǔn)化方法進(jìn)行評估;(2)作者整合了七種常用的數(shù)據(jù)標(biāo)準(zhǔn)化方法,為用戶提供了個性化選擇;作者不僅分析了復(fù)雜的醫(yī)學(xué)樣本數(shù)據(jù),還用了兩個已發(fā)表的數(shù)據(jù)進(jìn)行進(jìn)一步驗(yàn)證。結(jié)果證實(shí),“組熵”的方法可以對各個標(biāo)準(zhǔn)化方法在不同數(shù)據(jù)上應(yīng)用的合適性進(jìn)行評估;最后,作者將所有方法匯總整理,編寫成一個系統(tǒng)的在線工具(MetaboGroupS),極大地方便了使用者對其個性化的數(shù)據(jù)選擇合適的方法,避免了非專業(yè)人員對算法選擇的盲目性,從而提高了計(jì)算準(zhǔn)確性。


綜上所述,“組熵”的方法和該在線軟件是目前表現(xiàn)最佳的標(biāo)準(zhǔn)化方案選擇工具,在算法和概念上有較好的創(chuàng)新性和實(shí)用性。該方法使相關(guān)科研工作者要對自己的數(shù)據(jù)進(jìn)行標(biāo)準(zhǔn)化時能夠善假于物而善其事。



沈百榮,教授,四川大學(xué)華西醫(yī)院系統(tǒng)遺傳學(xué)研究院執(zhí)行院長,研究領(lǐng)域:生物醫(yī)學(xué)信息學(xué)、計(jì)算系統(tǒng)生物學(xué)、轉(zhuǎn)化醫(yī)學(xué)、健康大數(shù)據(jù)等。1997年復(fù)旦大學(xué)化學(xué)系博士畢業(yè)留校,1999年任副教授。2004年任芬蘭坦佩雷大學(xué)生物信息學(xué)助理教授,2005年底任同濟(jì)大學(xué)生物信息學(xué)教授、博士生導(dǎo)師。2008~2018年任蘇州大學(xué)系統(tǒng)生物學(xué)研究中心主任、教授、博導(dǎo),兼任美國西雅圖系統(tǒng)生物學(xué)研究所教授、HVP中國區(qū)工作委員會副主任、衛(wèi)計(jì)委和基金委項(xiàng)目終審專家等。2012年以來在國際上倡導(dǎo)轉(zhuǎn)化生物醫(yī)學(xué)信息學(xué),是國際轉(zhuǎn)化生物醫(yī)學(xué)信息學(xué)(ICTBI)系列會議的創(chuàng)始主席。2008年回國以來主持8個國家級項(xiàng)目,發(fā)表學(xué)術(shù)論文100多篇,中英文著作5本,培養(yǎng)博士和碩士研究生50多人。


作者投稿心得


數(shù)據(jù)標(biāo)準(zhǔn)化方法開發(fā)了很多,而怎樣較好地選擇這些方法卻鮮見探索和討論。“組熵”概念的提出豐富了這個方向,這也是在投稿過程中得到了編輯和審稿人認(rèn)可的主要原因。其次,除了處理我們實(shí)際測得的數(shù)據(jù)外,我們還將該方法在其它團(tuán)隊(duì)提供的多個數(shù)據(jù)中進(jìn)行驗(yàn)證,結(jié)果證實(shí)了我們算法的穩(wěn)定性。因此,大家以后若需開展類似研究,作者建議對多種方法或者使用多個數(shù)據(jù)集進(jìn)行比較驗(yàn)證,或許收獲更豐。


通信作者



龔萌,博士,副研究員,華西醫(yī)院代謝組學(xué)平臺主管;2000年本科畢業(yè)于四川大學(xué)生命科學(xué)學(xué)院,生物化學(xué)專業(yè);2006年于四川大學(xué)華西臨床醫(yī)學(xué)院獲得遺傳學(xué)博士學(xué)位;2006~2009年在四川大學(xué)華西醫(yī)院開展博士后研究工作,之后留院從事專職科研工作。研究方向主要為病毒感染和腫瘤發(fā)生發(fā)展的分子調(diào)控機(jī)制、代謝組學(xué)和脂質(zhì)組學(xué)分析方法學(xué)以及多組學(xué)在生物醫(yī)學(xué)中的應(yīng)用。期間先后獲得國家博士后研究基金、國家自然基金、成都市科技局、四川省科技廳等基金資助,參與研究生教材《醫(yī)學(xué)實(shí)驗(yàn)技術(shù)的原理與選擇》撰寫,以第一作者或通迅作者在Neuro-Oncology, Molecular Cancer Research, Analytical Chemistry 等期刊發(fā)表多篇論文,獲得國家發(fā)明專利授權(quán)兩項(xiàng)。


第一作者



王詩盛,本科畢業(yè)于哈爾濱工程大學(xué),碩士畢業(yè)于中國科學(xué)院大學(xué)上海生化與細(xì)胞研究所,現(xiàn)在四川大學(xué)華西醫(yī)院華西-華盛頓線粒體與代謝研究中心工作,主要從事蛋白質(zhì)組和代謝組的數(shù)據(jù)挖掘,同時熟悉單細(xì)胞測序數(shù)據(jù)分析,對數(shù)據(jù)爬蟲、文本分析、機(jī)器學(xué)習(xí)、深度學(xué)習(xí)等領(lǐng)域也有一定研究?;谒鶎W(xué)技能,目前編寫了一個數(shù)據(jù)分析的云平臺---悟空云,該云平臺涵蓋了數(shù)據(jù)前處理、單元和多元統(tǒng)計(jì)分析、富集分析、回歸分析、監(jiān)督和非監(jiān)督機(jī)器學(xué)習(xí)、深度學(xué)習(xí)、作圖等上百個模塊,極大地方便了非生物信息學(xué)背景的科研人員處理自己的數(shù)據(jù)。


共同第一作者



陳肖蕾,四川大學(xué)華西醫(yī)院腎臟內(nèi)科副主任醫(yī)師,醫(yī)學(xué)博士,2006年畢業(yè)于中國協(xié)和醫(yī)科大學(xué)。目前主要從事慢性腎臟疾病、代謝性腎臟病、血液凈化領(lǐng)域的研究。現(xiàn)已在國內(nèi)外醫(yī)學(xué)期刊發(fā)表論文20余篇,第一作者SCI論文6篇,并參與《血液凈化學(xué)》、《泌尿系統(tǒng)整合教材》、《實(shí)用血液凈化護(hù)理培訓(xùn)教程》等多部醫(yī)學(xué)專著的撰寫。作為主要研究者完成5項(xiàng)藥物和器械的臨床研究,主持省級科研項(xiàng)目和四川大學(xué)科研項(xiàng)目各1項(xiàng),參研國家自然科學(xué)基金等各級科研項(xiàng)目5項(xiàng),作為第一發(fā)明人獲實(shí)用新型專利1項(xiàng)。2013年入選四川大學(xué)青年骨干教師獎勵計(jì)劃。


版權(quán)聲明:華西微家倡導(dǎo)尊重和保護(hù)知識產(chǎn)權(quán)。歡迎轉(zhuǎn)載、引用,但需取得本平臺授權(quán)。如您對文章內(nèi)容版權(quán)存疑,請致電028-85422587,我們會與您及時溝通處理。本站內(nèi)容及圖片僅供參考、學(xué)習(xí)使用,不為盈利且不作為診斷、醫(yī)療根據(jù)。


本文編輯:張 敏

本文排版:陳紅梅 張洪雪

Format

Content