科研實(shí)驗(yàn)室每天需面對海量的數(shù)據(jù), 數(shù)據(jù)挖掘在科研管理工作中不應(yīng)還停留在紙上談兵或面子工程的狀態(tài),實(shí)驗(yàn)室信息化管理平臺(LIMS)數(shù)據(jù)分析模塊數(shù)據(jù)挖掘技術(shù)解決方案,重視科研數(shù)據(jù)的原始積累,增強(qiáng)科研管理項(xiàng)目決策的科學(xué)性, 為科研管理人提供更深層次的科研活動服務(wù)力度, 優(yōu)化科研資源的配置和管理。
實(shí)驗(yàn)室信息化管理平臺數(shù)據(jù)挖掘流程步驟:
第一、定義問題。
為使數(shù)據(jù)挖掘活動具有清晰準(zhǔn)確的目標(biāo),需要對要解決的問題進(jìn)行定義,要清楚地定位需要解決的問題是什么,如評價(jià)科研成果、評價(jià)科研效率等,因?yàn)椴煌哪繕?biāo)和問題所需要的模型是完全不同的。
第二、構(gòu)建數(shù)據(jù)挖掘庫。
在確定好需要解決的問題后,需要選擇有效的原始數(shù)據(jù)。對于數(shù)據(jù)挖掘技術(shù)的實(shí)施來說,原始數(shù)據(jù)通常是越多越好,但并不是需要濫用, 在收集到所有的數(shù)據(jù)后,要對其進(jìn)行一定的選擇,并對數(shù)據(jù)進(jìn)行描述與匯總,利用傳統(tǒng)的數(shù)據(jù)統(tǒng)計(jì)進(jìn)行元數(shù)據(jù)的搭建,形成數(shù)據(jù)庫。
第三、分析數(shù)據(jù)。
通常是利用數(shù)據(jù)分析軟件進(jìn)行數(shù)據(jù)的初步分析,因?yàn)樵紨?shù)據(jù)過于龐大,且很難找到重點(diǎn),應(yīng)借助 SPSS之類的工具進(jìn)行歸類,找出不同影響性的數(shù)據(jù)。
第四、準(zhǔn)備數(shù)據(jù)。
具體工作是選擇變量、選擇記錄、創(chuàng)建新變量、轉(zhuǎn)換變量。
第五、構(gòu)建模型。
通過數(shù)據(jù)挖掘?qū)崿F(xiàn)對某個(gè)問題的解決,需要的工作是多方面的,因此構(gòu)建模型需要長期實(shí)行,反復(fù)開展,需要對大量的算法和數(shù)學(xué)邏輯進(jìn)行參考,并在運(yùn)行后反復(fù)優(yōu)化。通常情況下會先用一部分信息構(gòu)建模型,并利用剩余的信息對模型進(jìn)行測試,甚至需要另一部分?jǐn)?shù)據(jù)進(jìn)行驗(yàn)證。
第六、模型的評價(jià)。
在對模型初步建立之后,還需要對其進(jìn)行綜合性地評價(jià),對不同的數(shù)據(jù)下得到的結(jié)果的合理性進(jìn)行專家評價(jià),使模型更有價(jià)值。在實(shí)踐中,通過數(shù)據(jù)挖掘技術(shù)來解決一定的問題,還面臨著經(jīng)濟(jì)、人力、技術(shù)等方面的限制,所以,應(yīng)評價(jià)這種模型實(shí)施的各方面的可行性。
第七、模型實(shí)施。
在建立了初步的模型并被認(rèn)定為可行之后,就能夠開展具體的實(shí)施,以對問題進(jìn)行及時(shí)有效地解決。
二、科研管理工作在數(shù)據(jù)挖掘技術(shù)下的轉(zhuǎn)變
1 、原始數(shù)據(jù)積累
LIMS提升科研單位的信息收集能力, 構(gòu)建更廣范的科技文獻(xiàn)、專利信息、論文信息以及科研單位自身各類信息的數(shù)據(jù)庫,包括科研工作者的基礎(chǔ)信息、科研成果等,并充分使用。還應(yīng)把科研管理的數(shù)據(jù)挖掘延伸到全球科研信息,如對于某個(gè)研究所來說,其研究的方向在全球有很多科研機(jī)構(gòu)與成果,該單位就應(yīng)在全球范圍內(nèi)進(jìn)行原始數(shù)據(jù)的收集。
在數(shù)據(jù)挖掘技術(shù)的發(fā)展中,應(yīng)當(dāng)對各類信息進(jìn)行準(zhǔn)確有效地收集,同時(shí)淘汰一些失去價(jià)值的數(shù)據(jù),如過期的甚至錯誤的科研成果等。
2、決策科學(xué)性
LIMS針對科研管理及數(shù)據(jù)挖掘機(jī)制的開拓,從具體的科研管理項(xiàng)目決策上入手, 使決策更具科學(xué)性。應(yīng)基于信息篩選的理念,進(jìn)一步細(xì)化科研管理工作,充分利用數(shù)據(jù)挖掘的優(yōu)勢思維。
LIMS平臺基于云計(jì)算的模式,對研究的領(lǐng)域、可能得到的學(xué)術(shù)成果進(jìn)行深入的分析積極地借鑒國內(nèi)外相關(guān)學(xué)術(shù)成果的現(xiàn)有文獻(xiàn),找出最合適的研究思路,并對科學(xué)課題的創(chuàng)新性和可行性進(jìn)行判斷,對其意義與必要性進(jìn)行判斷。
3、提升科研服務(wù)力度
各類科研機(jī)構(gòu)的科研項(xiàng)目,通常由科研工作者以某個(gè)機(jī)構(gòu)的研究為主進(jìn)行申請。和過去的科研活動管理、信息化技術(shù)的應(yīng)用相比,科研工作者僅是根據(jù)具體的科研工作,向上級領(lǐng)導(dǎo)單位進(jìn)行申請書的投遞,而后者則對申請內(nèi)容進(jìn)行進(jìn)一步分析。在具體的實(shí)踐中,會出現(xiàn)申請力度不足、相關(guān)數(shù)據(jù)殘缺、有一定的錯誤信息等,使得科研管理水平降低,有時(shí)會存在申請課題與實(shí)際需求差距較大,以致于最終申請無法通過。
LIMS平臺在數(shù)據(jù)挖掘技術(shù)的應(yīng)用過程中, 數(shù)據(jù)更加透明,也更為豐富,科研單位應(yīng)掌握數(shù)據(jù)挖掘的思維和技術(shù),對數(shù)據(jù)領(lǐng)域進(jìn)行分析、研究、準(zhǔn)確預(yù)測,探索構(gòu)建科研管理、數(shù)據(jù)挖掘的模型,與此同時(shí),基于數(shù)據(jù)可視化的理念,得到成型的相關(guān)報(bào)告,這可以給工作人員提供更為全面的數(shù)據(jù)信息,并對其中的內(nèi)在聯(lián)系進(jìn)行梳理。
4、資源合理配置及優(yōu)化
科研管理工作牽涉諸多的科研資源,管理單位應(yīng)對各種資源進(jìn)行合理配置,進(jìn)一步對數(shù)據(jù)管理進(jìn)行優(yōu)化。
第一,LIMS平臺對相關(guān)數(shù)據(jù)開展廣泛的采集和初步的篩選,構(gòu)建相應(yīng)的數(shù)據(jù)管理資源庫、人才庫、科研成果庫等。
第二,對科研機(jī)構(gòu)的自身發(fā)展進(jìn)行一定的科研評判,構(gòu)建相對健全的科研模型, 包括科研資源研究模型、科研成果模型等,并對其中的參數(shù)進(jìn)行有效地計(jì)算,進(jìn)一步制定完善的管理規(guī)則。
第三,LIMS平臺利用定量化績效考核的思路,及時(shí)搭建科研資源的基礎(chǔ)配置。以決策支持管理工具為基礎(chǔ),有效地對相應(yīng)的數(shù)據(jù)進(jìn)行管理, 基于數(shù)據(jù)挖掘的模式對科研機(jī)構(gòu)的資源開展科學(xué)配置。