《電子技術(shù)應(yīng)用》
您所在的位置:首頁(yè) > 通信與網(wǎng)絡(luò) > 設(shè)計(jì)應(yīng)用 > 時(shí)間序列數(shù)據(jù)可視化研究綜述*
時(shí)間序列數(shù)據(jù)可視化研究綜述*
2015年微型機(jī)與應(yīng)用第12期
戚陸越1,,2,吳 升1,2
1.福州大學(xué) 空間數(shù)據(jù)挖掘與信息共享教育部重點(diǎn)實(shí)驗(yàn)室,,福建 福州 350002,;2.福建省空間信息工程研究中心,,福建 福州 350002
摘要:  摘 要: 時(shí)間序列數(shù)據(jù)可視化綜合了時(shí)間序列數(shù)據(jù)挖掘,、數(shù)據(jù)可視化、計(jì)算機(jī)圖形學(xué),、計(jì)算機(jī)交互技術(shù)等學(xué)科的理論和方法,。從時(shí)間和數(shù)據(jù)兩個(gè)角度分析了時(shí)間序列數(shù)據(jù)的特征,;從用戶的角度探討了時(shí)間序列數(shù)據(jù)可視化的主要任務(wù);綜述了時(shí)間序列數(shù)據(jù)可視化從以人為中心到以計(jì)算機(jī)為中心,,再到人機(jī)交互方式的發(fā)展歷程,;詳細(xì)介紹了時(shí)間序列數(shù)據(jù)可視化的5類圖表和5類表達(dá)方式。最后,,對(duì)時(shí)間序列數(shù)據(jù)可視化研究進(jìn)行總結(jié)和展望,。
Abstract:
Key words :

摘  要時(shí)間序列數(shù)據(jù)可視化綜合了時(shí)間序列數(shù)據(jù)挖掘、數(shù)據(jù)可視化,、計(jì)算機(jī)圖形學(xué)、計(jì)算機(jī)交互技術(shù)等學(xué)科的理論和方法,。從時(shí)間和數(shù)據(jù)兩個(gè)角度分析了時(shí)間序列數(shù)據(jù)的特征,;從用戶的角度探討了時(shí)間序列數(shù)據(jù)可視化的主要任務(wù);綜述了時(shí)間序列數(shù)據(jù)可視化從以人為中心到以計(jì)算機(jī)為中心,,再到人機(jī)交互方式的發(fā)展歷程,;詳細(xì)介紹了時(shí)間序列數(shù)據(jù)可視化的5類圖表和5類表達(dá)方式。最后,,對(duì)時(shí)間序列數(shù)據(jù)可視化研究進(jìn)行總結(jié)和展望,。
  關(guān)鍵詞: 時(shí)間序列;可視化,;交互
0 引言
  時(shí)間序列數(shù)據(jù)是按時(shí)間順序排列的一系列觀測(cè)值,。與一般的定量數(shù)據(jù)不同,時(shí)間序列數(shù)據(jù)包含時(shí)間屬性,,不僅要表達(dá)數(shù)據(jù)隨時(shí)間變化的規(guī)律,,還需表達(dá)數(shù)據(jù)分布的時(shí)間規(guī)律。早期,,人們將時(shí)間序列數(shù)據(jù)繪制在圖紙上,,以圖形可視化的方法來發(fā)現(xiàn)時(shí)間序列數(shù)據(jù)的規(guī)律。計(jì)算機(jī)技術(shù)發(fā)展以來,,涌現(xiàn)出許多基于時(shí)間序列數(shù)據(jù)的研究[1],,例如相似序列搜索、降維,、聚類,、分類、模式分析,、預(yù)測(cè)等,,但主要是基于計(jì)算機(jī)進(jìn)行數(shù)據(jù)挖掘和機(jī)器學(xué)習(xí),對(duì)于人機(jī)交互可視化的研究較少,。人的眼睛具有很強(qiáng)的模式識(shí)別能力,,是輔助模式搜索,、模式匹配、模式發(fā)現(xiàn)等數(shù)據(jù)挖掘任務(wù)的有力工具,。如何將海量的時(shí)間序列中隱含的知識(shí)規(guī)律,,以人們易于理解的方式進(jìn)行交互可視化,是非常值得研究的問題,。目前,,數(shù)據(jù)可視化技術(shù)已被廣泛地應(yīng)用于呈現(xiàn)、探索和分析時(shí)間序列數(shù)據(jù),,并出現(xiàn)了一些可視化工具,,如Treemaps[2]、ThemeRiver[3],、Spirals[4-7]等,。時(shí)間序列數(shù)據(jù)可視化已成為數(shù)據(jù)挖掘的前沿研究領(lǐng)域,因?yàn)樗鼘C(jī)器智能與人腦智能更加緊密地結(jié)合,,讓傳統(tǒng)的“黑箱”挖掘過程變得清晰可見,,讓用戶更好地參與到整個(gè)數(shù)據(jù)挖掘過程之中,因此具有廣闊的應(yīng)用前景,。
1 時(shí)間序列數(shù)據(jù)的特征
  時(shí)間序列數(shù)據(jù)的定義包含兩個(gè)方面,,一是數(shù)據(jù)與時(shí)間密切相關(guān),并隨時(shí)間變化,;二是數(shù)據(jù)按時(shí)間的先后順序排列,。因而,時(shí)間序列數(shù)據(jù)的特征包含以下兩個(gè)方面:
 ?。?)時(shí)間屬性[8]
  時(shí)間具有特殊的語(yǔ)義結(jié)構(gòu),,經(jīng)過人為抽象劃分為不同層次的時(shí)間尺度,例如分,、時(shí),、天、周,、月等,。各層次間的包含關(guān)系有的是規(guī)則的(例如60分鐘為一小時(shí),7天為一周等),,有的是不規(guī)則的(例如一個(gè)月可以是30天或31天),。時(shí)間隱含內(nèi)在的周期性特征,例如季節(jié)的更迭,。時(shí)間還具有確定性和不確定性的特征,,例如列車經(jīng)過站點(diǎn)的時(shí)間有一定的規(guī)律,但也可因特殊情況晚點(diǎn),導(dǎo)致時(shí)間不確定,。
 ?。?)數(shù)據(jù)屬性[8]
  按統(tǒng)計(jì)尺度分為定性和定量特征;按參照標(biāo)準(zhǔn)可分為非空間和空間特征,;按變量個(gè)數(shù)分為單變量和多變量特征,。
2 時(shí)間序列數(shù)據(jù)可視化的主要任務(wù)
  從用戶任務(wù)的角度,時(shí)間序列數(shù)據(jù)可視化有以下幾個(gè)基本目的:分類,、聚類,、查詢、模式發(fā)現(xiàn)和預(yù)測(cè),;從用戶分析進(jìn)程的角度,,概括起來有以下三個(gè)基本目的:探究分析、驗(yàn)證分析,、分析結(jié)果表達(dá),。
  (1)探究分析
  探究分析的目的是洞悉數(shù)據(jù),,從時(shí)間序列數(shù)據(jù)中提取相關(guān)信息,,并提出假設(shè),。即從問題出發(fā),,先分析數(shù)據(jù),從數(shù)據(jù)中發(fā)現(xiàn)模式規(guī)律,、異常值,、離群值等,再?gòu)臄?shù)據(jù)導(dǎo)出模型,。
  探究分析包含兩個(gè)方面的任務(wù):發(fā)現(xiàn)數(shù)值的規(guī)律和發(fā)現(xiàn)時(shí)間的規(guī)律,。具體任務(wù)如表1所示。

Image 002.png

 ?。?)驗(yàn)證分析
  驗(yàn)證分析的目的是證明或推倒假設(shè)(假設(shè)源于數(shù)據(jù)的探究過程或數(shù)據(jù)相關(guān)的模型),。
  (3)分析結(jié)果表達(dá)
  分析結(jié)果表達(dá)的目的是傳遞和分享數(shù)據(jù)分析結(jié)果,。
3 時(shí)間序列數(shù)據(jù)可視化的研究進(jìn)展
  計(jì)算機(jī)未出現(xiàn)以前,,時(shí)間序列數(shù)據(jù)的可視化主要以手繪為主,例如AIGNER W[8]是現(xiàn)代統(tǒng)計(jì)圖形的創(chuàng)建人,,他用餅圖,、輪廓圖、條形圖,、折線圖等描述經(jīng)濟(jì)時(shí)間序列數(shù)據(jù),。JOSEPH繪制的人物傳記圖,用時(shí)間軸描述著名歷史人物的壽命[8]。隨著計(jì)算機(jī)技術(shù)和可視化技術(shù)的發(fā)展,,時(shí)間序列數(shù)據(jù)的可視化在圖表可視化方法,、表達(dá)方式、交互方式等方面不斷豐富與發(fā)展,。
  3.1 時(shí)間序列數(shù)據(jù)的可視化圖表
  歸納起來,,時(shí)間序列數(shù)據(jù)可視化圖表主要有以下幾類:
  (1)傳統(tǒng)統(tǒng)計(jì)圖表
  傳統(tǒng)的統(tǒng)計(jì)圖表是最簡(jiǎn)單而常見的時(shí)間序列數(shù)據(jù)的表示方法,,例如折線圖,、條形圖、金字塔圖,、雷達(dá)圖[9],、星狀圖等。
 ?。?)樹圖
  樹圖[10]是一種層次數(shù)據(jù)的可視化方法,。GOUTHAMI C[2]綜合樹圖提供全局概貌和坐標(biāo)軸統(tǒng)計(jì)圖提供趨勢(shì)特征的優(yōu)勢(shì),設(shè)計(jì)了一種表示時(shí)間序列數(shù)據(jù)的樹圖可視化交互系統(tǒng),,并以微博數(shù)據(jù),、石油日產(chǎn)量數(shù)據(jù)等為例介紹樹圖表現(xiàn)時(shí)間序列數(shù)據(jù)的方法。
 ?。?)熱力圖
  熱力圖(heatmap)是時(shí)間序列數(shù)據(jù)進(jìn)行聚類分析的有效方法,,它采用顏色編碼系統(tǒng)對(duì)數(shù)據(jù)進(jìn)行可視化。主要有兩類,,一類為顏色矩陣圖,,用顏色值對(duì)二維陣列中的數(shù)值編碼,如參考文獻(xiàn)[11]用heatmap表示“9·11恐怖襲擊事件”之后4個(gè)監(jiān)測(cè)站點(diǎn)的9種多環(huán)芳烴濃度值的變化規(guī)律,。另一類以地圖為背景,,疊加顯示與地理位置相關(guān)的熱點(diǎn),生成熱點(diǎn)圖,,像百度熱力圖,。
  (4)日歷圖
  參考文獻(xiàn)[4]提出基于聚類和日歷圖的可視化方法,,可表現(xiàn)和識(shí)別多時(shí)間尺度(天,、周、月)的單變量時(shí)間序列數(shù)據(jù)的模式和趨勢(shì),。日歷圖可按日歷的形式展示時(shí)間序列數(shù)據(jù)的全局特征,,對(duì)于單變量的、特定的,、已知時(shí)間尺度的時(shí)間序列數(shù)據(jù)表現(xiàn)效果較好,,而對(duì)多變量,、模式未知、無先驗(yàn)知識(shí)的時(shí)間序列數(shù)據(jù)的表現(xiàn)具有一定局限性,。
 ?。?)螺旋圖
  螺旋圖有利于分析時(shí)間序列數(shù)據(jù)的周期特征。CARLIS J V等人[5]首次提出螺旋圖的原型,,用點(diǎn),、條形圖的大小表示數(shù)值。之后,,螺旋圖在維度[6],、螺線形狀模型[7]、交互[12]等方面的表達(dá)不斷改進(jìn)與發(fā)展,。如參考文獻(xiàn)[12]從視覺表達(dá)和交互兩方面對(duì)傳統(tǒng)的螺旋圖進(jìn)行改進(jìn),,用雙色著色編碼方法和概括+細(xì)節(jié)的交互方式表現(xiàn)溫度序列數(shù)據(jù)。
  3.2 時(shí)間序列數(shù)據(jù)可視化的表達(dá)方式
 ?。?)隱喻表達(dá)法
  隱喻表達(dá)法基于用戶熟知的認(rèn)知背景建立易于理解和使用的可視化環(huán)境,。例如,ThemeRiver[3]用河流隱喻為時(shí)間,,河流自左向右流動(dòng)表示時(shí)間前進(jìn)方向,,河流的寬度、顏色等可視變量表示不同的主題對(duì)象和屬性值,。參考文獻(xiàn)[13]用樹的年輪隱喻為時(shí)間,,圓心表示時(shí)間的起點(diǎn),沿半徑向外發(fā)散的射線表示其他屬性,。
 ?。?)三維表達(dá)法
  與二維表達(dá)相比,,三維表達(dá)可能會(huì)遮擋或隱藏部分信息,,沒有二維表達(dá)直觀,但可表現(xiàn)高維的時(shí)間序列數(shù)據(jù),。例如參考文獻(xiàn)[14]提出時(shí)間隧道,,將兩種及以上不同的可視化視圖疊加顯示來分析數(shù)據(jù)的異同;參考文獻(xiàn)[15]設(shè)計(jì)了一種基于網(wǎng)絡(luò)圖的三維交互可視化環(huán)境,,以時(shí)間切片的方式對(duì)時(shí)間序列數(shù)據(jù)進(jìn)行三維可視化,。
  (3)地圖結(jié)合表達(dá)法
  地圖與其他可視化方式相結(jié)合可較好地呈現(xiàn)與空間位置相關(guān)的時(shí)間序列數(shù)據(jù),。時(shí)間序列與空間位置的關(guān)系包含兩個(gè)方面,,(1)位置作為時(shí)間序列的外部屬性,單條序列的位置穩(wěn)定,,例如參考文獻(xiàn)[16]將3D鉛筆圖標(biāo)和3D螺旋圖標(biāo)配置到地圖上,,分別表達(dá)月度醫(yī)療時(shí)空序列在時(shí)間上的線性變化和周期變化特征以及空間上的分布特征。參考文獻(xiàn)[17]基于GIS設(shè)計(jì)了圓環(huán)地圖來表達(dá)25個(gè)郵政編碼標(biāo)識(shí)區(qū)域24周內(nèi)的疾病時(shí)間序列數(shù)據(jù)。(2)位置是時(shí)間序列的內(nèi)部屬性,,記錄事件隨時(shí)間的位置變化,,如參考文獻(xiàn)[18]將地圖和折線圖相結(jié)合建立時(shí)空立方體,表現(xiàn)實(shí)時(shí)運(yùn)動(dòng)對(duì)象的移動(dòng)軌跡,。
 ?。?)郵票表達(dá)法
  郵票表達(dá)法指基于某種可視化方法將時(shí)間序列數(shù)據(jù)按時(shí)間點(diǎn)生成一系列圖表,并在一個(gè)視圖空間內(nèi)有序地平鋪展示,。該方法既可表示時(shí)間序列的全局概貌,,又能以縮略圖的形式呈現(xiàn)每個(gè)圖表的細(xì)節(jié),但在時(shí)間上缺乏連續(xù)性,,對(duì)時(shí)間多維,、高密度的時(shí)序數(shù)據(jù)及屏幕大小有一定的局限性。郭殿升等人[19]提出VIS-Stamp系統(tǒng),,按時(shí)間點(diǎn)平鋪展現(xiàn)地圖的縮略圖,,以對(duì)犯罪時(shí)空序列數(shù)據(jù)進(jìn)行可視分析。
 ?。?)動(dòng)畫表達(dá)法
  動(dòng)畫表達(dá)法指在一個(gè)視圖空間內(nèi)逐幀地播放時(shí)序數(shù)據(jù)可視圖表,,動(dòng)態(tài)、連續(xù)地展現(xiàn)時(shí)序數(shù)據(jù)的變化趨勢(shì),。HANS R[20]提出Trendalyzer,,基于交互的動(dòng)態(tài)氣泡圖表現(xiàn)經(jīng)濟(jì)、社會(huì)等統(tǒng)計(jì)數(shù)據(jù)的變化趨勢(shì),。ROBERTSON G[20]將Trendalyzer與兩種靜態(tài)表達(dá)法在趨勢(shì)分析的效力方面進(jìn)行對(duì)比,,其結(jié)果表明,Trendalyzer雖然在表達(dá)上快速,、生動(dòng),,但在準(zhǔn)確性和分析效果方面略遜一籌。
  3.3 時(shí)間序列數(shù)據(jù)的交互可視化
  時(shí)間序列數(shù)據(jù)的交互可視化旨在將“黑箱”分析過程透明化,,為用戶提供可視,、可控的分析環(huán)境?;镜目梢暬换ゲ僮鞣椒ㄖ饕衃8]:選擇,、平移、縮放,、查詢,、布局、編碼,、抽象/具體,、過濾,、畫筆鏈接等。
  常見的交互可視化模型有3種[8,,21]:概括+細(xì)節(jié)模型,、聚焦+上下文模型、對(duì)偶界面模型,。概括+細(xì)節(jié)模型旨在解決用戶在同一時(shí)間只能關(guān)注有限數(shù)據(jù)的問題,,該模型首先提供數(shù)據(jù)的全局視圖,通過放大,、過濾等交互操作獲得關(guān)注數(shù)據(jù)的細(xì)節(jié)圖,。聚焦+上下文模型可解決一個(gè)視圖中無法顯示所有數(shù)據(jù)的問題,該模型為用戶呈現(xiàn)關(guān)注數(shù)據(jù)的細(xì)節(jié)并適度地展示上下文信息,。對(duì)偶界面模型指對(duì)應(yīng)于相同數(shù)據(jù)的不同視圖之間相互關(guān)聯(lián),,對(duì)其中任意一個(gè)視圖的內(nèi)容進(jìn)行操作,其余視圖的內(nèi)容都隨之變化,,可充分利用多個(gè)視圖協(xié)同呈現(xiàn)數(shù)據(jù)的不同特征,。
4 結(jié)論
  本文主要從3個(gè)方面對(duì)時(shí)間序列數(shù)據(jù)可視化的研究進(jìn)行歸納總結(jié):(1)可視化呈現(xiàn)什么數(shù)據(jù),需考慮時(shí)間屬性和數(shù)據(jù)屬性兩方面的特征,;(2)可視化完成什么任務(wù),,即用戶需解決什么問題;(3)基于給定的數(shù)據(jù)和任務(wù)如何選擇合適的圖表,、表達(dá)方式可視化及交互設(shè)計(jì),,以期為時(shí)間序列數(shù)據(jù)分析提供新的思路。
  目前,,時(shí)間序列數(shù)據(jù)的可視化面臨多方面的挑戰(zhàn),。隨著計(jì)算機(jī)技術(shù)的發(fā)展,時(shí)間序列的數(shù)據(jù)量更為龐大,,數(shù)據(jù)的周期模式更為隱秘,,傳統(tǒng)的時(shí)間序列數(shù)據(jù)可視化方法遇到許多瓶頸,亟需改進(jìn)傳統(tǒng)的時(shí)間序列數(shù)據(jù)可視化的表達(dá)方式,;或結(jié)合多個(gè)視圖建立交互式的分析系統(tǒng),,而如何實(shí)現(xiàn)多視圖的交互操作是當(dāng)前研究的重點(diǎn)和難點(diǎn),。將可視化技術(shù),、交互技術(shù)與時(shí)間序列數(shù)據(jù)分析方法更緊密地結(jié)合起來而不是獨(dú)立地研究是探索和分析時(shí)間序列數(shù)據(jù)的趨勢(shì)。
  參考文獻(xiàn)
  [1] FU T C. A review on time series data mining[J]. Engineering Applications of Artificial Intelligence,,2011,,24(1):164-181.
  [2] GOUTHAMI C. Temporal treemaps for visualizing time series data[D]. University of Maryland, 2004.
  [3] 張龍飛,,姚中華,,宋漢辰,,等.基于Themeriver的可視化技術(shù)發(fā)展綜述[J].系統(tǒng)仿真學(xué)報(bào),2013,,25(9):2091-2096.
  [4] VAN W,, VAN S. Cluster and calendar based visualization of time series data[C]. IEEE Symposium on Information Visualization, San Francisco,, 1999:24-29.
  [5] CARLIS J V,, KONSTAN J A. Interactive visualization of serial periodic data[C]. 11th Anual Symposium on User Interface Software and Technology, 1998:29-38.
  [6] SIRIPATANA A,, JAROENSUTASINEE K,, PRUEKSAAROOM S, et al. The development of interactive 3D spring visualization for periodic multidimensional direction time-series data sets[C]. 9th International Conference on Electrical Engineering,, 2012:1-4.
  [7] CHENG S H,, JIANG Z F, QI Q,, et al. The polar parallel coordinates method for time-series data visualization[C]. 2012 International Conference on Systems and Informatics,, 2012:11-14,161.
  [8] AIGNER W,, MIKSCH S,, SCHUMANN H, et al. Visualization of time-oriented data[M]. London:Human-Computer Interaction Series,, 2011.
  [9] 楊婷,,吳升.案事件時(shí)空聯(lián)機(jī)分析處理與可視化[J].微型機(jī)與應(yīng)用,2014,,33(11):85-87.
  [10] 張昕,,袁曉如.樹圖可視化[J].計(jì)算機(jī)輔助設(shè)計(jì)與圖形學(xué)學(xué)報(bào),2012,,24(9):1113-1124.
  [11] PLEIL J D,, STIEGEL M A, MADDEN M C,, et al. Heat map visualization of complex environmental and biomarker measurements[J]. Chemosphere,, 2011, 84:716-723.
  [12] TOMINSKI C,,SCHUMANN H. Enhanced interactive spiral display[C]. Proceedings of the Annual SIGRAD Conference,, 2008:53-56.
  [13] ESPER J. Influence of wood harvest on tree-ring time-series of picea abies[J]. Forest Ecology and Management, 2012,,284:86-92.
  [14] AKAISHI M,,OKADA Y. Time-tunnel: visual analysis tool for time-series numerical data and its extension toward parallel coordinates[C]. IEEE 8th International Conference on Information Visualization, 2004:456-461.
  [15] ITOH M,, TOYODA M,, KITSUREGAWA M. An interactive visualization framework for time-series of Web graphs in a 3D environment [C]. 14th International Conference on Information Visualization,, 2010:26-29.
  [16] TOMINSKI C, SCHULZE-WOLLGAST P,, SCHUMANN H. 3D information visualization for time dependent data on maps[C]. Proceedings of International Conference on Information Visualization,, 2005.
  [17] HUANG G, GOVONI S,, CHOI J. Geovisualizing data with ring maps[J]. ArcUser,, 2008, 10(2):54-55.
  [18] VINH P T,, THI H N. Visualization cube for tracking moving object time-oriented[C]. 2011 International Conference on Information and Electronics Engineering,, 2011(6):258-262.
  [19] Guo Dianheng, Chen Jin,, MACEACHREN A M,, et al. A visualization system for space-time and multivariate patterns(VIS-STAMP)[J]. IEEE Transactions on Visualization and Computer Graphics, 2006,,12(6):1461-1474.
  [20] ROBERTSON G,, FERNANDEZ R, FISHER D,, et al. Effectiveness of animation in trend visualization[J]. IEEE Transactions on Visualization and Computer Graphics,, 2008,14(16):1325-1332.
  [21] 陳為,,張嵩,,魯愛東.?dāng)?shù)據(jù)可視化的基本原理與方法[M].北京:科學(xué)出版社,2013.

此內(nèi)容為AET網(wǎng)站原創(chuàng),,未經(jīng)授權(quán)禁止轉(zhuǎn)載,。