文獻(xiàn)標(biāo)識(shí)碼: A
DOI:10.16157/j.issn.0258-7998.2016.11.001
中文引用格式: 姚雪梅,李少波,,璩晶磊,,等. 制造大數(shù)據(jù)相關(guān)技術(shù)架構(gòu)分析[J].電子技術(shù)應(yīng)用,2016,,42(11):10-13.
英文引用格式: Yao Xuemei,,Li Shaobo,Qu Jinglei,,et al. Analyzing the technical framework of manufacturing big data[J].Application of Electronic Technique,,2016,42(11):10-13.
1 制造大數(shù)據(jù)的產(chǎn)生和研究現(xiàn)狀
1.1 制造大數(shù)據(jù)的研究現(xiàn)狀
大數(shù)據(jù)一詞在《The Third Wave》一書中最早被提出后,,在農(nóng)業(yè)、交通,、金融,、醫(yī)療、遙感等行業(yè)得到了充分的發(fā)展和應(yīng)用,,制造業(yè)也不例外,,尤其在2013年的《中國大數(shù)據(jù)技術(shù)與產(chǎn)業(yè)發(fā)展白皮書》中,明確指出在制造業(yè)采用大數(shù)據(jù)技術(shù)可以減少20%到50%的產(chǎn)品開發(fā)時(shí)間,,促進(jìn)制造業(yè)的轉(zhuǎn)型升級,;在2014年的《大數(shù)據(jù)標(biāo)準(zhǔn)化白皮書》中強(qiáng)調(diào)必須推動(dòng)大數(shù)據(jù)在大規(guī)模制造業(yè)生產(chǎn)過程中的應(yīng)用,鼓勵(lì)企業(yè)運(yùn)用大數(shù)據(jù)開展個(gè)性化定制,,創(chuàng)新生產(chǎn)管理模式,,降低生產(chǎn)成本,提高企業(yè)競爭力,。
文獻(xiàn)[1]提出一種基于服務(wù)的制造數(shù)據(jù)管理方法,,實(shí)現(xiàn)了產(chǎn)品研制和生產(chǎn)制造過程的有效管理;文獻(xiàn)[2]利用物聯(lián)網(wǎng)技術(shù)加強(qiáng)制造信息的管理和服務(wù),,旨在利用大數(shù)據(jù)技術(shù)構(gòu)建一個(gè)高效節(jié)能,、綠色環(huán)保的人性化工廠;文獻(xiàn)[3]利用RFID技術(shù)實(shí)現(xiàn)生產(chǎn)制造過程的工人,、工序,、工件、工時(shí)的實(shí)時(shí)統(tǒng)計(jì)和分析,,便于質(zhì)量管理和追溯的目的,;文獻(xiàn)[4]提出一套制造執(zhí)行系統(tǒng)的關(guān)鍵技術(shù)體系和實(shí)現(xiàn)框架,為解決生產(chǎn)制造過程實(shí)時(shí)數(shù)據(jù)采集和傳輸提供了技術(shù)支持,;文獻(xiàn)[5]闡述了一種融合RFID和條形碼的生產(chǎn)制造過程自動(dòng)識(shí)別技術(shù),;文獻(xiàn)[6]通過對制造單元感知實(shí)體屬性和感知設(shè)備方面的分析,實(shí)現(xiàn)對生產(chǎn)線制造過程的實(shí)時(shí)跟蹤,、精確管理,。
綜上文獻(xiàn)資料,學(xué)術(shù)界近幾年對制造領(lǐng)域的數(shù)據(jù)分析和處理進(jìn)行了大量的科學(xué)研究,。隨著制造業(yè)信息化進(jìn)程的推進(jìn),,制造業(yè)產(chǎn)生的數(shù)據(jù)量呈爆炸式增長趨勢,傳統(tǒng)的數(shù)據(jù)分析和挖掘算法在數(shù)據(jù)維度和規(guī)模增大時(shí),,需要的內(nèi)存和硬件資源呈指數(shù)級增長,,尤其是處理PB級別數(shù)據(jù)量時(shí),其時(shí)空復(fù)雜度表現(xiàn)為線性增長,超出人們能夠忍受的正常范圍,,急需更簡單有效的算法來解決當(dāng)前的問題,。本文在闡述制造大數(shù)據(jù)研究現(xiàn)狀的基礎(chǔ)上,綜合分析其來源,,給出制造大數(shù)據(jù)的定義,,并提出一種制造大數(shù)據(jù)的技術(shù)架構(gòu),同時(shí)展開其關(guān)鍵技術(shù)的探討,。
1.2 制造大數(shù)據(jù)的產(chǎn)生
E-works的黃培博士早在2012績效年會(huì)開幕致辭《中國制造業(yè)的大數(shù)據(jù)時(shí)代》中提到制造業(yè)處于數(shù)據(jù)爆炸的時(shí)代,。車間的產(chǎn)品數(shù)據(jù),流通階段的運(yùn)營數(shù)據(jù),,客戶,、廠商和合作者之間的價(jià)值鏈數(shù)據(jù)、市場的輿情數(shù)據(jù),、行業(yè)競爭對手的數(shù)據(jù),、國家政策信息以及PDM、MES,、ERP,、CRM、SCM,、CAD/M/E,、CAPP等軟件和RFID射頻識(shí)別、物聯(lián)網(wǎng),、傳感器,、電子標(biāo)簽、互聯(lián)網(wǎng)+等技術(shù)在制造業(yè)的廣泛應(yīng)用,,促進(jìn)了制造模式的創(chuàng)新,,產(chǎn)生了制造大數(shù)據(jù)。
1.3 制造大數(shù)據(jù)的概念
目前業(yè)界對大數(shù)據(jù)的定義尚有爭議,,研究機(jī)構(gòu)Gartner認(rèn)為“大數(shù)據(jù)”是在新處理模式下具有更強(qiáng)的決策力,、洞察發(fā)現(xiàn)力和流程優(yōu)化能力的海量、高增長率和多樣化的信息資產(chǎn),;麥肯錫給出的定義是:一種在獲取,、存儲(chǔ)、管理,、分析方面規(guī)模巨大,,超出了傳統(tǒng)軟件工具能力范圍的數(shù)據(jù)集合,具有海量的數(shù)據(jù)規(guī)模,、快速的數(shù)據(jù)流轉(zhuǎn)、多樣的數(shù)據(jù)類型和價(jià)值密度低四大特征[7-8],后者的觀點(diǎn)更能得到業(yè)界的普遍認(rèn)同,。
綜合各界對大數(shù)據(jù)的闡述,,結(jié)合制造業(yè)信息化的概念及應(yīng)用[9],將制造大數(shù)據(jù)定義為:制造業(yè)通過網(wǎng)絡(luò)化,、數(shù)字化形成的海量異構(gòu)制造行業(yè)數(shù)據(jù)資產(chǎn)匯聚,,通過信息驅(qū)動(dòng)的制造行業(yè)數(shù)據(jù)資源應(yīng)用,為改造和提升制造業(yè)創(chuàng)新制造及服務(wù)能力,、促進(jìn)轉(zhuǎn)型升級,、實(shí)現(xiàn)智慧制造提供了支撐[10]。
2 制造大數(shù)據(jù)的技術(shù)架構(gòu)
2.1 制造大數(shù)據(jù)處理流程分析
制造大數(shù)據(jù)的處理流程[11]如圖1所示,,主要包括以下部分:(1)傳感器,,是制造大數(shù)據(jù)的主要采集工具;(2)采集中間件,,負(fù)責(zé)源數(shù)據(jù)的采集,,同時(shí)對數(shù)據(jù)預(yù)處理,消除數(shù)據(jù)不確定性,,規(guī)范化處理數(shù)據(jù),;(3)存儲(chǔ)中間件,制造大數(shù)據(jù)具有海量,、異構(gòu),、實(shí)時(shí)、多源的特點(diǎn),,從而要求存儲(chǔ)設(shè)備實(shí)現(xiàn)性能和容量的線性擴(kuò)展,;(4)處理中間件,數(shù)據(jù)處理離不開規(guī)則約束下的有效挖掘,,因此,,高效的人工智能、機(jī)械學(xué)習(xí),、數(shù)據(jù)挖掘算法是基礎(chǔ)技術(shù),;(5)安全管理中間件,制造大數(shù)據(jù)的應(yīng)用絕大部分用于車間,、工廠,、企業(yè)、市場,,其數(shù)據(jù)的安全性和準(zhǔn)確性直接關(guān)系到應(yīng)用的有效性,;(6)制造大數(shù)據(jù)應(yīng)用,是制造業(yè)信息化,、網(wǎng)絡(luò)化,、智能化的最終體現(xiàn),。
2.2 制造大數(shù)據(jù)技術(shù)架構(gòu)分析
基于數(shù)據(jù)驅(qū)動(dòng)的制造大數(shù)據(jù)處理流程分析,提出如圖2所示的制造大數(shù)據(jù)技術(shù)架構(gòu),,主要包括數(shù)據(jù)采集,、預(yù)處理、分析,、應(yīng)用4個(gè)部分[12-13],。(1)數(shù)據(jù)采集,以傳感器為主要采集工具,,結(jié)合FRID,、條碼掃描器、生產(chǎn)和監(jiān)測設(shè)備,、PDA,、人機(jī)交互、智能終端等手段采集制造領(lǐng)域多源,、異構(gòu)數(shù)據(jù)信息,,并通過互聯(lián)網(wǎng)等技術(shù)實(shí)現(xiàn)源數(shù)據(jù)的實(shí)時(shí)準(zhǔn)確傳輸。采集的源數(shù)據(jù)歸納起來一共是結(jié)構(gòu)化,、半結(jié)構(gòu)化,、非結(jié)構(gòu)化三類數(shù)據(jù),相應(yīng)的數(shù)據(jù)說明如表1所示,。(2)數(shù)據(jù)預(yù)處理,,首次采集獲得的源數(shù)據(jù)是多維異構(gòu)的,為避免噪音或干擾項(xiàng)給后期分析帶來的困難,,必須執(zhí)行同構(gòu)化處理,,同時(shí)將處理結(jié)果有效存儲(chǔ)在性能和容量都能線性擴(kuò)展的分布式數(shù)據(jù)庫中。數(shù)據(jù)預(yù)處理包括四個(gè)步驟[14]:數(shù)據(jù)清洗,、數(shù)據(jù)交換,、數(shù)據(jù)集成、數(shù)據(jù)歸約,;(3)數(shù)據(jù)分析,,在傳統(tǒng)數(shù)據(jù)挖掘的基礎(chǔ)上,結(jié)合新興的云計(jì)算,、Hadoop,、專家系統(tǒng)等對同構(gòu)數(shù)據(jù)執(zhí)行高效準(zhǔn)確地分析運(yùn)算,并用可視化技術(shù)展示結(jié)果,;(4)數(shù)據(jù)應(yīng)用,,主要應(yīng)用于車間、工廠的流程管控和優(yōu)化,,產(chǎn)品研發(fā)的決策支持,,質(zhì)量檢測和故障預(yù)警,,供應(yīng)鏈優(yōu)化等方面。
2.3 制造大數(shù)據(jù)關(guān)鍵技術(shù)分析
制造系統(tǒng)中不僅包括制造設(shè)備軟硬件,,還包括制造工藝等多維異構(gòu)數(shù)據(jù),。提高采集、分析和處理制造數(shù)據(jù)的能力,,真實(shí)客觀地反映制造過程,是確保生產(chǎn)制造過程高效,、可靠的關(guān)鍵,。其中,云計(jì)算是基礎(chǔ),;分布式文件系統(tǒng)為其提供數(shù)據(jù)存儲(chǔ)架構(gòu),;分布式數(shù)據(jù)庫便于數(shù)據(jù)管理,同時(shí)提供高效的訪問速度,;MapReduce等技術(shù)對異構(gòu)數(shù)據(jù)進(jìn)行分析處理,,最后利用可視化技術(shù)形象生動(dòng)地呈現(xiàn)在用戶眼前,滿足用戶需求,。
(1)云計(jì)算
在海量制造數(shù)據(jù)面前,,如何分析、提取有效信息是企業(yè)的當(dāng)務(wù)之急,。來自公有云,、私有云和混合云之上的強(qiáng)大的云計(jì)算能力[15],是提取大數(shù)據(jù)價(jià)值的前提,。云計(jì)算的核心服務(wù)包括三種類型:SaaS,、PaaS和IaaS[16]。
(2)分布式技術(shù)
分布式文件系統(tǒng)是指管理模式下的實(shí)際存儲(chǔ)資源,,有的與本地節(jié)點(diǎn)直接物理連接,,有的則通過互聯(lián)網(wǎng)與本地相連[17]。目前常見的分布式文件系統(tǒng)有GFS,、S3,、TFS等。
分布式數(shù)據(jù)庫的基本思想是將原來集中式關(guān)系型數(shù)據(jù)庫中的數(shù)據(jù)分散存儲(chǔ)到多個(gè)通過網(wǎng)絡(luò)連接的數(shù)據(jù)存儲(chǔ)節(jié)點(diǎn)上,,以獲取更大的存儲(chǔ)容量和更高的并發(fā)訪問量,。目前常見的分布式數(shù)據(jù)庫有BigTable、PNUTS和Dynamo等,。
(3)MapReduce技術(shù)
MapReduce是基于Hadoop分布式平臺(tái)下的一種計(jì)算機(jī)編程模型,,適用于大規(guī)模數(shù)據(jù)集的并行計(jì)算,它為底層程序員提供了一種快速開發(fā),、分析處理海量數(shù)據(jù)的環(huán)境,,并且使這種模型下開發(fā)出來的程序能夠在一些大型的商業(yè)集群上以一種高速,、穩(wěn)定、容錯(cuò)的方式運(yùn)行[18-19],。
(4)可視化技術(shù)
數(shù)據(jù)可視化主要是借助于圖形化手段,,清晰有效地傳達(dá)與溝通信息,便于非專業(yè)人士根據(jù)需要從不同的角度觀察和分析數(shù)據(jù),。如今,,可視化的研究和應(yīng)用已經(jīng)覆蓋了科研界、企業(yè)界,、社交網(wǎng)絡(luò)等多個(gè)領(lǐng)域,。目前常用的可視化工具有FushionCarts、Tableau,、Dipity等,。
3 制造大數(shù)據(jù)的應(yīng)用
(1)基于制造大數(shù)據(jù)的產(chǎn)品研發(fā)決策與優(yōu)化
美國的福特汽車公司利用大數(shù)據(jù)分析的技術(shù),打破公司內(nèi)部數(shù)據(jù)孤島,,通過分析外部收集的數(shù)據(jù)和內(nèi)部反饋的詳細(xì)數(shù)據(jù),,探索最佳工藝指標(biāo)和生產(chǎn)流程,改進(jìn)或幫助改變其業(yè)務(wù)模式,,對內(nèi)指導(dǎo)公司生產(chǎn)流水線,,提高產(chǎn)品質(zhì)量,對外推廣市場,,贏得較好的口碑和效益,,使得福特實(shí)現(xiàn)了連續(xù)17個(gè)季度盈利。
(2)基于制造大數(shù)據(jù)的生產(chǎn)流程管控與優(yōu)化
家居行業(yè)的尚品宅配利用大數(shù)據(jù)分析的技術(shù),,串聯(lián)整個(gè)產(chǎn)業(yè)鏈,,實(shí)現(xiàn)了柔性生產(chǎn)和大規(guī)模定制。通過收集樓盤,、房型數(shù)據(jù)建立房型庫,,再擴(kuò)展到產(chǎn)品庫、設(shè)計(jì)庫,、解決方案庫的三位一體,,形成云設(shè)計(jì)庫?;诖?,公司產(chǎn)能提高了10倍,出錯(cuò)率則從30%下降到了3%以下,,交貨周期從30天縮短到了15天以內(nèi),,實(shí)現(xiàn)了徹底的零庫存。
(3)基于制造大數(shù)據(jù)的價(jià)值鏈集成和綜合決策
中國石油依托大數(shù)據(jù)技術(shù)發(fā)展其“資源,、市場,、國際化”的戰(zhàn)略,。首先,通過挖掘數(shù)據(jù)潛在價(jià)值,,實(shí)現(xiàn)新的油氣增產(chǎn),;其次,通過完善數(shù)據(jù)收集分析和監(jiān)測體系,,擴(kuò)大市場份額,;最后,通過對重點(diǎn)資源國地緣政治,、經(jīng)濟(jì)動(dòng)態(tài)的分析和把握,,建立良性互動(dòng)的競爭合作關(guān)系,從而為正確實(shí)施“走出去”戰(zhàn)略,,降低海外投資風(fēng)險(xiǎn)提供保障。
4 制造大數(shù)據(jù)的挑戰(zhàn)
結(jié)合我國制造業(yè)的現(xiàn)狀和大數(shù)據(jù)的瓶頸,,制造大數(shù)據(jù)帶來的挑戰(zhàn)表現(xiàn)為以下幾點(diǎn):
(1)制造大數(shù)據(jù)多源異構(gòu)融合的復(fù)雜性
制造大數(shù)據(jù)來源廣泛,,種類繁多,關(guān)系繁雜,。目前缺乏對實(shí)時(shí),、多源、不確定數(shù)據(jù)的有效自動(dòng)識(shí)別和獲取的解決方案,,致使數(shù)據(jù)質(zhì)量參差不齊,,難以實(shí)現(xiàn)低成本、低能耗,、高可靠性的目標(biāo),。如何構(gòu)建融合多源異構(gòu)數(shù)據(jù)的泛化模型是制造大數(shù)據(jù)在感知、分析和處理時(shí)面臨的巨大挑戰(zhàn),。
(2)制造大數(shù)據(jù)團(tuán)隊(duì)的核心技術(shù)和運(yùn)營理念
中國的制造業(yè)大而不強(qiáng),,源于兩個(gè)因素:核心技術(shù)依賴于國外、缺乏資源整合和運(yùn)作的團(tuán)隊(duì)領(lǐng)導(dǎo)能力,。大數(shù)據(jù)的熱潮帶來了創(chuàng)新的思維模式和革新的信息技術(shù),,實(shí)現(xiàn)技術(shù)升級和管理升級是中國制造業(yè)面臨的迫切需求。因此,,如何培養(yǎng)一批“懂中國”,、“懂技術(shù)”、“懂管理”的本土專業(yè)人才是當(dāng)前面臨的又一大挑戰(zhàn),。
(3)制造大數(shù)據(jù)技術(shù)有效實(shí)施的安全手段
制造大數(shù)據(jù)自身的特點(diǎn)決定了其處理方式的多樣性,、靈活性和廣泛性,大量數(shù)據(jù)信息跨界傳送,,使得安全問題相伴而生,。黑客,、病毒、人為故障,、自然災(zāi)害等因素都是潛在的安全隱患,。常用的數(shù)據(jù)保護(hù)措施不再適用,如何開發(fā)出行之有效的保密手段將是下一階段的難點(diǎn)之一,。
5 制造大數(shù)據(jù)展望
兩化深度融合,、發(fā)展戰(zhàn)略性新興產(chǎn)業(yè)和先進(jìn)制造業(yè)是保持我國制造業(yè)競爭優(yōu)勢的重要支撐。未來十年是我國制造業(yè)依靠制造大數(shù)據(jù)技術(shù)轉(zhuǎn)型升級,,從“制造大國”走向“制造強(qiáng)國”的關(guān)鍵時(shí)期,。通過大力推行數(shù)字化、網(wǎng)絡(luò)化,、智能化手段,,提高創(chuàng)新設(shè)計(jì)能力,提升產(chǎn)品質(zhì)量,,主要發(fā)展以下方向:
(1)基于制造大數(shù)據(jù)的可持續(xù)發(fā)展
可持續(xù)生產(chǎn)發(fā)展關(guān)鍵的兩個(gè)方面是能源消耗的最小化和廢物排放最少化,。因此,制造產(chǎn)品全生命周期中對環(huán)境資源的一體化需求驅(qū)使用戶思考和使用新的決策工具,。借助于制造大數(shù)據(jù)的契機(jī),,積極推進(jìn)制造業(yè)的轉(zhuǎn)型升級,通過采集,、存儲(chǔ),、分析制造業(yè)的大數(shù)據(jù)有望實(shí)現(xiàn)制造業(yè)資源的浪費(fèi)最小化和能源最大化利用的目標(biāo)。
(2)基于制造大數(shù)據(jù)的智慧制造
在制造業(yè)轉(zhuǎn)型升級過程中,,制造業(yè)正朝著數(shù)字化,、信息化、網(wǎng)絡(luò)化,、綠色化為一體的智慧制造方向前進(jìn),。在未來一段時(shí)期,基于制造大數(shù)據(jù)技術(shù)的智慧制造企業(yè)將支撐起中國制造業(yè)的可持續(xù)發(fā)展,,智慧工廠就是一個(gè)典型,。在智慧工廠中,通過人與智能設(shè)備的有機(jī)協(xié)作,,利用物聯(lián)網(wǎng)感知監(jiān)控技術(shù)加強(qiáng)生產(chǎn)線的可控性,,最終提升企業(yè)競爭力,促進(jìn)工業(yè)增長,。
(3)基于制造大數(shù)據(jù)的互聯(lián)網(wǎng)+協(xié)同制造
依托互聯(lián)網(wǎng)+,,制造業(yè)需要通過兩化深度融合,利用制造大數(shù)據(jù)技術(shù)實(shí)現(xiàn)用戶、車間,、工廠,、企業(yè)等各個(gè)環(huán)節(jié)數(shù)據(jù)的快速傳遞,構(gòu)建網(wǎng)絡(luò)化協(xié)同制造公共服務(wù)平臺(tái),,加快形成網(wǎng)絡(luò)化制造業(yè)生態(tài)體系,,實(shí)現(xiàn)產(chǎn)品全生命周期的互聯(lián)、互通,、協(xié)同,,真正滿足市場客戶的個(gè)性化定制需求,使企業(yè)實(shí)現(xiàn)從單純制造向“制造+服務(wù)”的轉(zhuǎn)型升級,,最終促進(jìn)國民經(jīng)濟(jì)的發(fā)展,。
參考文獻(xiàn)
[1] 劉威,喬立紅,,楊建軍.基于服務(wù)的制造數(shù)據(jù)管理[J].計(jì)算機(jī)集成制造系統(tǒng),,2009(7):1342-1348.
[2] JAMES T.Smart factories[J].Engineering and Technology,2012,,7(6):64-67.
[3] YAO X,,DAI H,ZHANG Z.RFID-enhanced integrated manufacturing for Job-shop floor problems[J].Icic Express Letters Part B Applications,,2011(2):319-324.
[4] 張映鋒,趙曦濱,,孫樹棟,,等.一種基于物聯(lián)技術(shù)的制造執(zhí)行系統(tǒng)實(shí)現(xiàn)方法與關(guān)鍵技術(shù)[J].計(jì)算機(jī)集成制造系統(tǒng),2012(12):2634-2642.
[5] LIU W N,,ZHENG L J,,SUN D H,et al.RFID-enabled real-time production management system for Loncin motorcycle assembly line[J].International Journal of Computer Integrated Manufacturing,,2012,,25(1):86-99.
[6] 彭煜.制造單元物聯(lián)感知關(guān)鍵技術(shù)的研究與實(shí)踐[D].武漢:武漢理工大學(xué),2013.
[7] 王珊,,王會(huì)舉,,覃雄派,等.架構(gòu)大數(shù)據(jù):挑戰(zhàn),、現(xiàn)狀與展望[J].計(jì)算機(jī)學(xué)報(bào),,2011(10):1741-1752.
[8] 王元卓,靳小龍,,程學(xué)旗.網(wǎng)絡(luò)大數(shù)據(jù):現(xiàn)狀與展望[J].計(jì)算機(jī)學(xué)報(bào),,2013(6):1125-1138.
[9] 顧新建,張棟,,紀(jì)楊建,,等.制造業(yè)服務(wù)化和信息化融合技術(shù)[J].計(jì)算機(jī)集成制造系統(tǒng),,2010(11):2530-2536.
[10] 陳偉興,李少波,,黃海松.離散型制造物聯(lián)過程數(shù)據(jù)主動(dòng)感知及管理模型[J].計(jì)算機(jī)集成制造系統(tǒng),,2016(1):166-176.
[11] 張桂剛,畢婭,,李超,,等.海量物聯(lián)網(wǎng)數(shù)據(jù)安全處理模型研究[J].小型微型計(jì)算機(jī)系統(tǒng),2013(9):2090-2094.
[12] 孟小峰,,慈祥.大數(shù)據(jù)管理:概念,、技術(shù)與挑戰(zhàn)[J].計(jì)算機(jī)研究與發(fā)展,2013(1):146-169.
[13] 劉智慧,,張泉靈.大數(shù)據(jù)技術(shù)研究綜述[J].浙江大學(xué)學(xué)報(bào)(工學(xué)版),,2014(6):957-972.
[14] HUANG J,LI Y F,,XIE M.An empirical analysis of data preprocessing for machine learning-based software cost estimation[J].Information & Software Technology,,2015,67:108-127.
[15] MELL P,,GRANCE T.The NIST definition of cloud computing[J].National Institute of Standards and Technology,,2009,53(6):50.
[16] QI Z,,LU C,,BOUTABA R.Cloud computing: state-of-the-art and research challenges[J].Journal of Internet Services & Applications,2010,,1(1):7-18.
[17] 周江,,王偉平,孟丹,,等.面向大數(shù)據(jù)分析的分布式文件系統(tǒng)關(guān)鍵技術(shù)[J].計(jì)算機(jī)研究與發(fā)展,,2014(2):382-394.
[18] 覃雄派,王會(huì)舉,,杜小勇,,等.大數(shù)據(jù)分析——RDBMS與MapReduce的競爭與共生[J].軟件學(xué)報(bào),2012(1):32-45.
[19] XIAO Z,,XIAO Y.Achieving Accountable MapReduce in cloud computing[J].Future Generation Computer Systems,,2014,30(1):1-13.