生物醫(yī)學(xué)大數(shù)據(jù)的現(xiàn)狀與展望
摘要生物醫(yī)學(xué)是一門新興的前沿交叉學(xué)科,它綜合了醫(yī)學(xué)、生命科學(xué)和生物學(xué)的理論和方法而發(fā)展起來.近年來隨著先進儀器裝備與信息技術(shù)等越來越廣泛和深入的整合到生物技術(shù)中來,生物醫(yī)學(xué)研究中越來越頻繁的涉及到大數(shù)據(jù)存儲和分析等信息技術(shù).大數(shù)據(jù)時代的來臨對生物醫(yī)學(xué)研究產(chǎn)生了重大影響.其中,一個重要發(fā)展趨勢就是由假設(shè)驅(qū)動向數(shù)據(jù)驅(qū)動的轉(zhuǎn)變.數(shù)十年來分子生物學(xué)水平上的實驗?zāi)康氖谦@得結(jié)論或者是提出一種新的假設(shè),而現(xiàn)在基于海量生物醫(yī)學(xué)大數(shù)據(jù),可以對海量數(shù)據(jù)的研究來探索其中的規(guī)律,直接提出假設(shè)或得出可靠的結(jié)論.隨著先進的生物分析技術(shù)的不斷推出和更新,生物醫(yī)學(xué)數(shù)據(jù)迅速積累.基于此類大數(shù)據(jù)一些以往不能解決的問題將有望解決,同時相關(guān)生物醫(yī)學(xué)研究的新問題也層出不窮.生物醫(yī)學(xué)相關(guān)的大數(shù)據(jù)技術(shù)和相關(guān)應(yīng)用主要包括:基于高通量測序的個性化基因組、轉(zhuǎn)錄組和蛋白組研究,單細胞水平基因型和表型研究,人類健康相關(guān)微生物群落研究,生物醫(yī)學(xué)圖像研究等.相關(guān)生物醫(yī)學(xué)大數(shù)據(jù)分析任務(wù)均具有著數(shù)據(jù)密集和計算密集的雙密集性特點.要充分地利用這些大數(shù)據(jù)解決一系列生物醫(yī)學(xué)問題,迫切需要高通量、高效率、高準(zhǔn)確性的生物信息存儲和分析策略.本文總結(jié)和回顧生物醫(yī)學(xué)大數(shù)據(jù)的生成、管理和分析相關(guān)的一系列問題,其中重點討論人體微生物群落、單細胞表型和基因型、生物醫(yī)學(xué)圖像等新近出現(xiàn)的生物醫(yī)學(xué)大數(shù)據(jù)形式,以及相關(guān)數(shù)據(jù)分析和應(yīng)用前景等.基于目前生物醫(yī)學(xué)大數(shù)據(jù)的現(xiàn)狀我們可以發(fā)現(xiàn),生物醫(yī)學(xué)大數(shù)據(jù)的研究正處于蓄勢待發(fā)狀態(tài):適應(yīng)于生物醫(yī)學(xué)大數(shù)據(jù)的軟硬件平臺、大數(shù)據(jù)存儲、大數(shù)據(jù)分析挖掘等方法等還不成熟,制約著生物大數(shù)據(jù)的研究.然而一旦相關(guān)研究獲得突破并有所優(yōu)化和應(yīng)用,將會全方位地支撐生物醫(yī)學(xué)大數(shù)據(jù)的深入解構(gòu);進而有助于對醫(yī)學(xué)現(xiàn)象的趨勢分析和預(yù)測,服務(wù)于相關(guān)的遺傳疾病研究、公共衛(wèi)生監(jiān)控、醫(yī)療與醫(yī)藥開發(fā)等廣泛生物醫(yī)學(xué)應(yīng)用.
關(guān)鍵詞生物醫(yī)學(xué)大數(shù)據(jù)微生物群落單細胞醫(yī)學(xué)圖像數(shù)據(jù)挖掘
生物醫(yī)學(xué)是應(yīng)用生物醫(yī)學(xué)信息、醫(yī)學(xué)影像技術(shù)、基因芯片、納米技術(shù)、新材料等技術(shù)的學(xué)術(shù)研究和創(chuàng)新交叉領(lǐng)域.隨著以“社會-心理-生物”為代表的大醫(yī)學(xué)模式的提出和系統(tǒng)生物學(xué)的發(fā)展,形成了現(xiàn)代系統(tǒng)生物醫(yī)學(xué)[1,2].面向生物醫(yī)學(xué)的系統(tǒng)生物學(xué)研究是與21世紀(jì)生物技術(shù)技術(shù)和大數(shù)據(jù)技術(shù)密切相關(guān)的領(lǐng)域,是關(guān)系到提高醫(yī)療診斷水平和人類健康的重要研究領(lǐng)域.
更新了一篇醫(yī)學(xué)相關(guān)的論文,如中獸醫(yī)醫(yī)藥雜志是國家級刊物嗎,您可以點擊并前往查看。
1生物醫(yī)學(xué)大數(shù)據(jù)研究的特點
1.1大數(shù)據(jù)的重要性
高通量的研究思路和相關(guān)數(shù)據(jù)生產(chǎn)方式的飛躍是大數(shù)據(jù)產(chǎn)生的主要因素.大數(shù)據(jù)經(jīng)歷著從概念到小范圍技術(shù)實踐,最終到廣泛接受并成為一個新興研究方向的歷程.2008年9月,Nature雜志率先出版了由Howe等人[4]所發(fā)論文組成的“大數(shù)據(jù)???rdquo;,表明大數(shù)據(jù)的影響已觸及自然科學(xué)、社會科學(xué)和工程學(xué)的各個領(lǐng)域.2009年10月,TheFourthParadigm:DataIntensiveScientificDiscovery[5]一書的出版,顯示出與大數(shù)據(jù)關(guān)系密切的數(shù)據(jù)密集型科學(xué)發(fā)現(xiàn)范式已被確立和廣泛認可.2011年2月,Science雜志推出Overpeck等人[6]所發(fā)表文章組成的“數(shù)據(jù)處理???rdquo;.2012年5月,聯(lián)合國發(fā)布大數(shù)據(jù)政務(wù)白皮書BigDataforDevelopment:Challenges&Opportunities[7],體現(xiàn)了大數(shù)據(jù)領(lǐng)域的研究計劃在國家戰(zhàn)略層面的重要性.2014年Science雜志推出“Bigbiologicalimpactsfrombigdata”[8]等一系列評論,也明確無誤地表明了生物學(xué)相關(guān)研究已進入大數(shù)據(jù)時代.
1.2生物醫(yī)學(xué)大數(shù)據(jù)的特點
以高通量測序儀器、單細胞檢測裝備和實時動態(tài)圖像系統(tǒng)為代表的新一代生物分析平臺已經(jīng)和正在為生物醫(yī)學(xué)研究提供海量數(shù)據(jù),而要充分利用蘊藏于海量數(shù)據(jù)中的深刻規(guī)律,大數(shù)據(jù)驅(qū)動的研究策略必不可少[9].大數(shù)據(jù)至少包含3層含義(3V)(圖1):數(shù)據(jù)量大(volumeofdata),處理數(shù)據(jù)的速度快(velocityofprocessingthedata),數(shù)據(jù)源多變(variabilityofdatasources).這是那些依賴大數(shù)據(jù)進行分析和預(yù)測過程的重要特征[10].具體到生物醫(yī)學(xué)大數(shù)據(jù)研究而言,大數(shù)據(jù)研究的3V特點體現(xiàn)如下:第一,生物醫(yī)學(xué)數(shù)據(jù)量大.通常對于一個樣本的人體基因組和轉(zhuǎn)錄組(多組織多時間點)測序數(shù)據(jù)量會分別超過100和30GB(基于3GB人類基因組和10~30倍測序深度).考慮到一次試驗中通常會涉及到數(shù)百個甚至上萬個人體樣本,相關(guān)的數(shù)據(jù)量產(chǎn)出十分巨大.第二,研究對于處理結(jié)果準(zhǔn)確性和處理速度均有較高要求.如個性化醫(yī)療[11],就具有較高的時效性要求,而單細胞測序及診斷等[12],對突變位點和功能模塊的鑒別準(zhǔn)確性要求較高.第三,相關(guān)源數(shù)據(jù)來源多變且具有較大的異質(zhì)性.同時生物醫(yī)學(xué)數(shù)據(jù)的分析和解釋通常會利用到NCBI系列[13]等通用數(shù)據(jù)庫以及UniProt(www.uniprot.org)等專業(yè)數(shù)據(jù)庫.源數(shù)據(jù)和數(shù)據(jù)庫的異質(zhì)性,會導(dǎo)致數(shù)據(jù)缺失、數(shù)據(jù)矛盾等問題的普遍存在,成為相關(guān)大數(shù)據(jù)整合與分析的瓶頸.正是因為生物醫(yī)學(xué)研究具有典型的3V特點,所以需要依靠大數(shù)據(jù)思維和數(shù)據(jù)分析策略對生物醫(yī)學(xué)數(shù)據(jù)進行深入挖掘.
2生物醫(yī)學(xué)大數(shù)據(jù)的典型應(yīng)用
典型的生物醫(yī)學(xué)數(shù)據(jù)包括癌癥、個性化醫(yī)療等數(shù)據(jù),其呈現(xiàn)形式包括功能基因組、單細胞、宏基因組(又稱元基因組)數(shù)據(jù)等.所有這些數(shù)據(jù)存儲于NCBI或EBI等大型通用數(shù)據(jù)庫中.同時隨著高通量測序技術(shù)的發(fā)展和應(yīng)用以及生物技術(shù)與信息技術(shù)的融合,NCBI等大型通用數(shù)據(jù)庫中生物醫(yī)學(xué)數(shù)據(jù)類型和數(shù)據(jù)規(guī)模不斷增大[15](圖2).
3生成海量大數(shù)據(jù)的先端生物技術(shù)
生物醫(yī)學(xué)大數(shù)據(jù)的研究依賴于高通量、高質(zhì)量的數(shù)據(jù)生成線段生物技術(shù)和相關(guān)儀器.目前生物醫(yī)學(xué)大數(shù)據(jù)的來源主要有3種:(1)DNA測序儀器;(2)高通量高精度質(zhì)譜儀;(3)高通量高精度表觀型分析儀器.詳見圖3.
4生物醫(yī)學(xué)大數(shù)據(jù)的分析
生物醫(yī)學(xué)大數(shù)據(jù)可以分為大數(shù)據(jù)存儲和大數(shù)據(jù)分析兩方面,其中大數(shù)據(jù)存儲服務(wù)于大數(shù)據(jù)的深入分析.當(dāng)今生物醫(yī)學(xué)中的典型大數(shù)據(jù)包括各類基因組數(shù)據(jù)、宏基因組數(shù)據(jù)和單細胞數(shù)據(jù)以及生物醫(yī)學(xué)圖像數(shù)據(jù)等.
參考文獻
1EngelGL.Theneedforanewmedicalmodel:Achallengeforbiomedicine.Science,1977,196:129–136
2AntonyP,BallingR,VlassisN.Fromsystemsbiologytosystemsbiomedicine.CurrOpinBiotechnol,2012,23:604–608
3CollinsFS,MansouraMK.Thehumangenomeproject.Cancer,2001,91:221–225
4HoweD,CostanzoM,FeyP,etal.Bigdata:Thefutureofbiocuration.Nature,2008,455:47–50
寧康①*,陳挺②③*
《生物醫(yī)學(xué)大數(shù)據(jù)的現(xiàn)狀與展望》
- 職稱論文刊發(fā)主體資格的
- 政法論文淺析工會法主體
- 化學(xué)在初中教學(xué)中的情感
- 中學(xué)教育論文思想政治方
- 法治論文投稿法治型市場
- 雜志社論文發(fā)表淺析推動
- 新疆教育報投稿淺析學(xué)生
- 分男女招生錄取的合憲性
最新優(yōu)質(zhì)論文
- 幼兒園職稱評定材料要求
- 人力資源薪酬管理論文能
- 天津教育被知網(wǎng)收錄嗎
- 幫忙發(fā)表ssci論文的機構(gòu)
- 怎么查找一個人發(fā)表過的
- 音樂類核心期刊有哪些
- 度假村相關(guān)文獻有哪些 查
- 中學(xué)語文教學(xué)期刊發(fā)表哪
論文發(fā)表問題熱點
- 設(shè)備維修的論文省級或國
- 監(jiān)理工程師的報考條件
- 高級園林工程師評職條件
- 簡述電氣工程師基礎(chǔ)考試
- 期刊上發(fā)表一篇論文需要
- 監(jiān)理工程師高級職稱評職
- 醫(yī)學(xué)論文準(zhǔn)備格式基本要
- 簡述測量工程師的崗位職