科研院所大數(shù)據(jù)中心建設(shè)研究
摘 要:科研院所在日常工作中,積累了大量的科研數(shù)據(jù)和科研成果,隨著信息技術(shù)的發(fā)展應(yīng)用,這些數(shù)據(jù)被廣泛分布在各個(gè)獨(dú)立的信息系統(tǒng)中。針對(duì)相關(guān)信息系統(tǒng)相對(duì)獨(dú)立,信息孤島效應(yīng)明顯,造成的資源極大浪費(fèi),提出在科研院所建設(shè)大數(shù)據(jù)中心,這不但有利于信息系統(tǒng)的互聯(lián)互通,有利于相關(guān)數(shù)據(jù)的統(tǒng)一存儲(chǔ)、管理和挖掘使用,而且有利于發(fā)揮現(xiàn)有數(shù)據(jù)的最大使用價(jià)值,提升數(shù)據(jù)資源的使用效率和信息系統(tǒng)的管理水平。
關(guān)鍵詞:科研院所 科研數(shù)據(jù) 大數(shù)據(jù)中心
當(dāng)前,很多科研院所的信息化建設(shè)水平不高,對(duì)科研數(shù)據(jù)的存儲(chǔ)、管理、分析和挖掘使用還停留在低層次,造成了數(shù)據(jù)資源的極大浪費(fèi)。推進(jìn)科研院所大數(shù)據(jù)中心建設(shè),可以有效解決以上問題。
1 建設(shè)科研院所大數(shù)據(jù)中心的意義
1.1 大數(shù)據(jù)中心概述
大數(shù)據(jù)技術(shù)實(shí)際上就是一種從數(shù)量龐大、種類繁多的數(shù)據(jù)中提取出有用信息的技術(shù)。大數(shù)據(jù)中心是集各相關(guān)領(lǐng)域的數(shù)據(jù)資源,形成一個(gè)大規(guī)模的數(shù)據(jù)庫(kù)平臺(tái),通過各種先進(jìn)的數(shù)據(jù)采集、數(shù)據(jù)存儲(chǔ)、數(shù)據(jù)管理、數(shù)據(jù)分析與挖掘等技術(shù),實(shí)現(xiàn)為政府、社會(huì)各界提供便捷的數(shù)據(jù)收集、查詢、分析、再加工等服務(wù),為科學(xué)研究、創(chuàng)業(yè)規(guī)劃、社會(huì)治理等提供必要的數(shù)據(jù)支撐和決策依據(jù)。
1.2 國(guó)內(nèi)外大數(shù)據(jù)中心發(fā)展現(xiàn)狀
自 2001 年以來世界各地的大數(shù)據(jù)中心建設(shè)高速發(fā)展。據(jù)統(tǒng)計(jì),全球大數(shù)據(jù)中心數(shù)量在 2015 年達(dá)到 855 萬座。從大數(shù)據(jù)中心的發(fā)展來看,2012—2017 年全球大數(shù)據(jù)中心年平均增長(zhǎng)率為 17.39% ,中國(guó)為 39.57% ;從大數(shù)據(jù)涉及的領(lǐng)域來看,目前大數(shù)據(jù)已經(jīng)滲透到各個(gè)行業(yè)和領(lǐng)域。美國(guó)大數(shù)據(jù)戰(zhàn)略發(fā)布后 12 個(gè)聯(lián)邦部門啟動(dòng)開展了 82 個(gè)大數(shù)據(jù)相關(guān)項(xiàng)目,涵蓋國(guó)防、國(guó)土安全、國(guó)家安全、能源、醫(yī)療衛(wèi)生、食品藥物、航空航天、人文社會(huì)科學(xué)、地質(zhì)勘查等眾多領(lǐng)域。我國(guó)的各大數(shù)據(jù)中心在新的發(fā)展規(guī)劃中,重點(diǎn)加強(qiáng)大數(shù)據(jù)與教育、醫(yī)療衛(wèi)生、生活?yuàn)蕵?、電子商?wù)、金融、工業(yè)、農(nóng)牧業(yè)、能源產(chǎn)業(yè)、公共服務(wù)、地理空間等領(lǐng)域的深度融合。業(yè)界普遍認(rèn)為,大數(shù)據(jù)將成為新發(fā)明和新服務(wù)的源泉,大數(shù)據(jù)時(shí)代將為人類的生活創(chuàng)造前所未有的變革。所以,建設(shè)大數(shù)據(jù)中心,利用大數(shù)據(jù)的思維和先進(jìn)的技術(shù)手段,有效管理和挖掘大規(guī)模數(shù)據(jù)資源中蘊(yùn)藏的價(jià)值,是當(dāng)下各行各業(yè)的關(guān)注焦點(diǎn)和發(fā)展方向。
1.3 科研院所數(shù)據(jù)資源保有和使用現(xiàn)狀
目前,國(guó)內(nèi)多數(shù)科研院所的信息系統(tǒng)相互獨(dú)立、無關(guān)聯(lián),各自向政府、社會(huì)提供服務(wù),存在著數(shù)據(jù)資源閑置,利用率不高;數(shù)據(jù)存儲(chǔ)和使用簡(jiǎn)單粗放,缺乏整理、清洗和分析功能,對(duì)領(lǐng)導(dǎo)宏觀決策幫助較小;各數(shù)據(jù)庫(kù)關(guān)聯(lián)性弱,數(shù)據(jù)之間缺乏支撐,不能被系統(tǒng)性使用;各個(gè)信息系統(tǒng)單獨(dú)維護(hù),維護(hù)成本相對(duì)較高;數(shù)據(jù)庫(kù)與外部數(shù)據(jù)連接接口較少,外部資源不能得到很好的利用和整合。這些問題嚴(yán)重制約了科研院所數(shù)據(jù)業(yè)務(wù)的發(fā)展和信息化建設(shè)水平。
1.4 建設(shè)科研院所大數(shù)據(jù)中心的作用
一是促進(jìn)系統(tǒng)集成,將原有的多個(gè)系統(tǒng)整合集成為一個(gè)或幾個(gè)大的信息系統(tǒng),破除信息孤島,節(jié)約運(yùn)營(yíng)和維護(hù)資源,降低網(wǎng)絡(luò)安全風(fēng)險(xiǎn);二是促進(jìn)現(xiàn)有數(shù)據(jù)資源的管理使用水平,減少重復(fù)研發(fā)投入和研發(fā)工作,同時(shí)使現(xiàn)有數(shù)據(jù)得到有效的分析挖掘,提升數(shù)據(jù)資源的使用效率;三是將主流的先進(jìn)信息技術(shù)引入單位信息化建設(shè)當(dāng)中,提升單位信息系統(tǒng)的智能化水平,提升用戶使用感受和單位信息化建設(shè)水平。
2 科研院所大數(shù)據(jù)中心建設(shè)的思路和原則
2.1 主要思路
當(dāng)前,多數(shù)大數(shù)據(jù)中心采用平臺(tái)化建設(shè)原則。筆者認(rèn)為,科研院所大數(shù)據(jù)中心建設(shè)應(yīng)圍繞主體業(yè)務(wù),以各部門需求為導(dǎo)向,集成現(xiàn)有的數(shù)據(jù)、系統(tǒng)及業(yè)務(wù)流程,形成統(tǒng)一的大數(shù)據(jù)資源中心,支撐全部業(yè)務(wù)全流程管理。同時(shí),筆者認(rèn)為,著眼未來發(fā)展,可以適當(dāng)引入云計(jì)算、區(qū)塊鏈等技術(shù),為相關(guān)業(yè)務(wù)預(yù)留發(fā)展接口,利用區(qū)塊鏈技術(shù)為跨級(jí)別、跨部門的數(shù)據(jù)互聯(lián)互通提供安全可信任的環(huán)境,形成可持續(xù)發(fā)展的運(yùn)維服務(wù)保障機(jī)制。
2.2 主要原則
2.2.1 資源共享及業(yè)務(wù)協(xié)同原則
遵循資源共享和業(yè)務(wù)協(xié)同原則,總體設(shè)計(jì),合理布局,由情報(bào)所統(tǒng)一規(guī)劃,各部門配合建設(shè),提升所數(shù)據(jù)資源共享和業(yè)務(wù)協(xié)同能力,并具備良好的系統(tǒng)集成能力、信息共享和交換能力、外部接口能力以及對(duì)標(biāo)準(zhǔn)規(guī)范的支持能力。
2.2.2 經(jīng)濟(jì)性和資源節(jié)約原則
大數(shù)據(jù)中心建設(shè)應(yīng)充分利用現(xiàn)有網(wǎng)絡(luò)資源、硬件設(shè)備、軟件系統(tǒng)、人力資源和數(shù)據(jù)資源,保護(hù)前期投資,確保現(xiàn)有系統(tǒng)與目標(biāo)系統(tǒng)之間的平滑過渡和無縫集成;慎重權(quán)衡性能與代價(jià)的關(guān)系,選擇適度超前的軟硬件產(chǎn)品,在保證系統(tǒng)先進(jìn)性的同時(shí),控制投資成本。
2.2.3 開放性和可擴(kuò)展性原則
平臺(tái)建設(shè)要按照開放性和可擴(kuò)展性原則設(shè)計(jì),必須既滿足當(dāng)前業(yè)務(wù)發(fā)展需求,又要考慮未來大數(shù)據(jù)處理及應(yīng)用的發(fā)展趨勢(shì),設(shè)計(jì)合理的擴(kuò)展架構(gòu),采用開放的、標(biāo)準(zhǔn)化的平臺(tái)設(shè)計(jì),合理分配利用基礎(chǔ)設(shè)施資源,實(shí)現(xiàn)現(xiàn)有業(yè)務(wù)系統(tǒng)平滑接入和擴(kuò)展。
2.2.4 易用性和便捷性原則
在系統(tǒng)建設(shè)時(shí),針對(duì)不同層面的使用者的應(yīng)用水平,充分考慮系統(tǒng)的易用性,充分考慮到使用者計(jì)算機(jī)操作水平,操作簡(jiǎn)單、方便,以保障信息化應(yīng)用的順利推廣。
3 科研院所大數(shù)據(jù)中心建設(shè)的主要任務(wù)
3.1 大數(shù)據(jù)中心的建設(shè)內(nèi)容
當(dāng)前,科研院所大數(shù)據(jù)中心建設(shè),按照“大平臺(tái)、大系統(tǒng)、大集成、大數(shù)據(jù)”的建設(shè)思想,基于云計(jì)算技術(shù),構(gòu)建可擴(kuò)展的一體化業(yè)務(wù)平臺(tái),形成人員、數(shù)據(jù)、管理等有機(jī)統(tǒng)一的大數(shù)據(jù)資源中心,利用采集、歸集、交換、網(wǎng)絡(luò)抓取等多種數(shù)據(jù)獲取技術(shù)和手段,實(shí)現(xiàn)對(duì)涉及主導(dǎo)業(yè)務(wù)的政策信息、科研數(shù)據(jù)等結(jié)構(gòu)化和非結(jié)構(gòu)化數(shù)據(jù)資源的整合處理、體系管理、共享交換、數(shù)據(jù)接口服務(wù)等功能。依托大數(shù)據(jù)中心,建立一體化業(yè)務(wù)處理平臺(tái),主要將對(duì)外服務(wù)功能進(jìn)行集成整合,實(shí)現(xiàn)資源與數(shù)據(jù)互聯(lián)互通,提供統(tǒng)一身份認(rèn)證、工作流引擎、數(shù)據(jù)挖掘引擎、系統(tǒng)管理等基礎(chǔ)平臺(tái)功能,通過數(shù)據(jù)、消息及界面實(shí)現(xiàn)與現(xiàn)有業(yè)務(wù)系統(tǒng)的集成應(yīng)用,通過統(tǒng)一身份認(rèn)證實(shí)現(xiàn)單點(diǎn)登錄?;诖髷?shù)據(jù)資源和一體化業(yè)務(wù)處理平臺(tái),全面集成現(xiàn)有的應(yīng)用業(yè)務(wù),整合內(nèi)部管理、對(duì)外服務(wù)、政務(wù)服務(wù)等業(yè)務(wù)管理流程,形成數(shù)據(jù)一致、流程協(xié)同、功能完整的應(yīng)用體系,提供兼容 PC 端和移動(dòng)端的多種應(yīng)用整合的服務(wù)。
3.2 大數(shù)據(jù)中心實(shí)現(xiàn)的主要功能
當(dāng)前,新建的大數(shù)據(jù)中心,至少要實(shí)現(xiàn)以下 8 項(xiàng)功能:①系統(tǒng)集成。實(shí)現(xiàn)科研院所業(yè)務(wù)系統(tǒng)高度集成目標(biāo),分散系統(tǒng)集中到統(tǒng)一平臺(tái),利用虛擬化和云計(jì)算技術(shù),實(shí)現(xiàn)硬件環(huán)境和網(wǎng)絡(luò)安全統(tǒng)一管理。業(yè)務(wù)部門負(fù)責(zé)提需求和使用,數(shù)據(jù)中心負(fù)責(zé)系統(tǒng)開發(fā)、升級(jí)、運(yùn)維和網(wǎng)絡(luò)安全,數(shù)據(jù)集中管理共享,提升數(shù)據(jù)資源使用效率,壓縮運(yùn)維和安全管理成本。②數(shù)據(jù)交換。實(shí)現(xiàn)科研院所各業(yè)務(wù)系統(tǒng)數(shù)據(jù)實(shí)時(shí)全流程無障礙交換,并構(gòu)建與上下級(jí)管理部門和業(yè)務(wù)單位的大數(shù)據(jù)中心相關(guān)系統(tǒng)的數(shù)據(jù)交換接口,實(shí)現(xiàn)數(shù)據(jù)實(shí)時(shí)無障礙交換對(duì)接。③數(shù)據(jù)加載清洗。實(shí)現(xiàn)各級(jí)業(yè)務(wù)系統(tǒng)的數(shù)據(jù)抽取和加載,主要包括數(shù)據(jù)源管理、數(shù)據(jù)關(guān)系匹配與轉(zhuǎn)換規(guī)則、審核規(guī)則設(shè)置、數(shù)據(jù)交換流程管理、數(shù)據(jù)交換引擎、任務(wù)異常監(jiān)控。④即席查詢。提供一個(gè)靈活的即席查詢工具,用戶可以根據(jù)自己的需要,靈活地設(shè)置查詢項(xiàng)及查詢條件,同時(shí)支持查詢條件的任意組合及與或關(guān)系。⑤多維在線分析。要能夠?yàn)橛脩籼峁┛梢暬?、?jiǎn)單易用的多維在線分析工具,通過鼠標(biāo)拖拽的方式,實(shí)現(xiàn)復(fù)雜多變的報(bào)表分析與展示。 ⑥智能圖表。提供圖表制定工具,用戶可以自行設(shè)置圖表展現(xiàn)形式、圖表間聯(lián)動(dòng)交互邏輯等。⑦智能檢索。利用關(guān)鍵字索引、字段索引技術(shù),實(shí)現(xiàn)智能搜索功能,根據(jù)用戶輸入的搜索內(nèi)容,自動(dòng)查詢相關(guān)指標(biāo)、報(bào)表、文檔、分析報(bào)告等內(nèi)容并實(shí)現(xiàn)一體化展示。 ⑧智能挖掘。用戶可以自己編寫數(shù)據(jù)挖掘算法,支持在線編譯、可視化分析、數(shù)據(jù)和圖表互動(dòng)、算法模型管理等功能。
3.3 總體架構(gòu)及功能模塊作用
科研院所建設(shè)大數(shù)據(jù)中心,應(yīng)該搞好頂層規(guī)劃,優(yōu)化總體架構(gòu),并精確定位功能模塊作用。在架構(gòu)設(shè)計(jì)方面,通常包括以下 5 個(gè)方面:①基礎(chǔ)設(shè)施層,提供數(shù)據(jù)綜合管理平臺(tái)建設(shè)部署所依賴的軟硬件基礎(chǔ)設(shè)施,包括計(jì)算資源、存儲(chǔ)設(shè)備、網(wǎng)絡(luò)設(shè)備及其他基礎(chǔ)設(shè)施。②數(shù)據(jù)層,實(shí)現(xiàn)各類數(shù)據(jù)資源的存儲(chǔ)及數(shù)據(jù)訪問接口服務(wù)。③平臺(tái)層,作為對(duì)應(yīng)用系統(tǒng)的支撐保障,主要功能為業(yè)務(wù)支撐及協(xié)同管理、系統(tǒng)集成及接口服務(wù)管理、數(shù)據(jù)交換與共享平臺(tái)、元數(shù)據(jù)與數(shù)據(jù)資源體系管理、數(shù)據(jù)資源整合與分析展現(xiàn)平臺(tái)等。④應(yīng)用層,主要集成各類應(yīng)用服務(wù)系統(tǒng),提供全新的流程優(yōu)化、集中的信息展示和系統(tǒng)之間的協(xié)作等功能。⑤ 展現(xiàn)層,通過 PC 端或移動(dòng)端實(shí)現(xiàn)數(shù)據(jù)查詢展現(xiàn)門戶功能,通過直觀的、多維度的信息展示,可為用戶提供服務(wù)領(lǐng)導(dǎo)決策、改進(jìn)工作方式、實(shí)時(shí)動(dòng)態(tài)監(jiān)控等作用。
3.4 應(yīng)用平臺(tái)和安全系統(tǒng)建設(shè)
3.4.1 應(yīng)用平臺(tái)建設(shè)
應(yīng)用平臺(tái)建設(shè)是大數(shù)據(jù)中心建設(shè)的關(guān)鍵環(huán)節(jié),它是平臺(tái)化建設(shè)思想的主要體現(xiàn),也是大數(shù)據(jù)主要功能的引擎和主要發(fā)力點(diǎn)。筆者認(rèn)為,科研單位大數(shù)據(jù)中心建設(shè),應(yīng)該至少包括數(shù)據(jù)資源共享交換平臺(tái)、數(shù)據(jù)資源體系管理平臺(tái)、數(shù)據(jù)資源整合和分析展示平臺(tái)、業(yè)務(wù)協(xié)同管理平臺(tái)、系統(tǒng)集成和接口服務(wù)平臺(tái)。
3.4.2 系統(tǒng)安全建設(shè)
信息資產(chǎn)安全運(yùn)營(yíng)威脅的來源主要包括:通過對(duì)外服務(wù)區(qū)來自于惡意用戶的攻擊、不同部門間人員的非法訪問、內(nèi)部人員的越權(quán)訪問、設(shè)備運(yùn)行故障、重要數(shù)據(jù)泄密等。全面地對(duì)信息系統(tǒng)網(wǎng)絡(luò)安全威脅進(jìn)行分析和歸類,根據(jù)安全風(fēng)險(xiǎn)的來源,參照業(yè)界通用的分析方法和國(guó)家《信息安全風(fēng)險(xiǎn)評(píng)估指南》《信息系統(tǒng)安全等級(jí)保護(hù)基本要求》,制定安全總體架構(gòu)。通用的安全架構(gòu)如圖 1 所示。
4 相關(guān)保障措施
4.1 劃撥專項(xiàng)系統(tǒng)建設(shè)和運(yùn)維經(jīng)費(fèi)
建議以項(xiàng)目形式,申請(qǐng)專項(xiàng)經(jīng)費(fèi)補(bǔ)助,完成項(xiàng)目建設(shè)。同時(shí),每年要列支專項(xiàng)運(yùn)維經(jīng)費(fèi),保障大數(shù)據(jù)中心的可持續(xù)發(fā)展。
4.2 調(diào)整運(yùn)維保障力量
對(duì)原有信息系統(tǒng)的運(yùn)維力量進(jìn)行整合,成立單位的大數(shù)據(jù)中心專門運(yùn)維部門,形成數(shù)據(jù)的產(chǎn)生、數(shù)據(jù)的存儲(chǔ)管理、數(shù)據(jù)的挖掘、數(shù)據(jù)的整理、數(shù)據(jù)的分析使用全鏈條運(yùn)維和保障力量,能夠?qū)崿F(xiàn)依靠自身力量完成上級(jí)和客戶賦予的數(shù)據(jù)處理、數(shù)據(jù)查詢、模型設(shè)計(jì)、數(shù)據(jù)分析和結(jié)果解讀等任務(wù)。
4.3 建立相關(guān)運(yùn)維管理制度
從日常工作、人員管理、任務(wù)分工、安全管理等方面,分別制定大數(shù)據(jù)中心建設(shè)、工作管理、人員職責(zé)、經(jīng)費(fèi)保障、安全預(yù)案等規(guī)章和制度,確保大數(shù)據(jù)日常工作的有序開展。
4.4 積極向上爭(zhēng)取任務(wù)和支持
要建立相關(guān)工作計(jì)劃,加快建設(shè)進(jìn)度,搶占先發(fā)優(yōu)勢(shì)。積極爭(zhēng)取上級(jí)部門對(duì)單位大數(shù)據(jù)中心的支持,爭(zhēng)取將所大數(shù)據(jù)中心納入上級(jí)相關(guān)信息化項(xiàng)目中同步建設(shè),同步運(yùn)維和發(fā)展,爭(zhēng)取相關(guān)資金和制度支持,提升單位大數(shù)據(jù)中心在上級(jí)部門宏觀決策層面的作用和影響力?!?/p>
參考文獻(xiàn)
[1] 徐雷. 2015 年江蘇省政府網(wǎng)站績(jī)效評(píng)估報(bào)告[R]. 江蘇省軟件產(chǎn)品檢測(cè)中心,2016.
[2] 周榮華,陳俊,周萍,等. 江 蘇 省 信 息 化 發(fā) 展 報(bào)告[Z]. 2016.
[3] 孫澤鵬. 大數(shù)據(jù)中心建設(shè)模式思考[J]. 中國(guó)信息化, 2017(7):68-70.
推薦閱讀:大數(shù)據(jù)背景下統(tǒng)計(jì)學(xué)本科教學(xué)體系研究
《科研院所大數(shù)據(jù)中心建設(shè)研究》
- 職稱論文刊發(fā)主體資格的
- 政法論文淺析工會(huì)法主體
- 化學(xué)在初中教學(xué)中的情感
- 中學(xué)教育論文思想政治方
- 法治論文投稿法治型市場(chǎng)
- 雜志社論文發(fā)表淺析推動(dòng)
- 新疆教育報(bào)投稿淺析學(xué)生
- 分男女招生錄取的合憲性
最新優(yōu)質(zhì)論文
- 環(huán)境工程晉升高級(jí)職稱條
- 知網(wǎng)能免費(fèi)下載論文嗎
- 音樂課老師晉升職稱必須
- 水利水電工程師職稱論文
- 寫高職英語教育的論文怎
- 職稱論文發(fā)表可靠網(wǎng)站有
- 膜分離相關(guān)論文發(fā)表期刊
- 河南群眾文化類職稱評(píng)審
論文發(fā)表問題熱點(diǎn)
- 學(xué)術(shù)期刊規(guī)范化需要注意
- 會(huì)計(jì)畢業(yè)論文職稱論文準(zhǔn)
- 中醫(yī)藥論文準(zhǔn)備常見問題
- 自考本科論文格式要求
- 哪能咨詢發(fā)表論文期刊的
- 泥泵磨損論文適合哪些期
- 工程師中級(jí)職稱評(píng)審條件
- 發(fā)表論文必須本省的期刊