誰該擁有你的社交網(wǎng)絡(luò)數(shù)據(jù)?
CNW.com.cn
范范編譯
摘要: 分布式計算(Hadoop)和大數(shù)據(jù)(Big Data)技術(shù)的一個重要應(yīng)用是分析用戶的社交行為,有些時候它們會在用戶毫不知情的情況下進行分析,。
Abstract:
Key words :
分布式計算(Hadoop)和大數(shù)據(jù)(Big Data)技術(shù)的一個重要應(yīng)用是分析用戶的社交行為,,有些時候它們會在用戶毫不知情的情況下進行分析。
大數(shù)據(jù)通常指大量不斷增長的數(shù)據(jù),,包括Facebook和Twitter網(wǎng)站上的非結(jié)構(gòu)化數(shù)據(jù),,以及從這些數(shù)據(jù)中收集信息創(chuàng)造商業(yè)機會的方法。然而,,這一概念對于那些在互聯(lián)網(wǎng)上展示自己生活的人來說具有風險,,同時也帶來了一個疑問,即到底誰該擁有這些數(shù)據(jù),?
大數(shù)據(jù)觸發(fā)大競技
大數(shù)據(jù)與Apache的Hadoop分布式計算平臺等技術(shù)相關(guān)聯(lián),,同時促使包括IBM在內(nèi)的一些技術(shù)公司展開重量級收購。不過,,GigaOm的分析師Derrick Harris指出,,“大數(shù)據(jù)”的定義存在一些問題。他認為,,大數(shù)據(jù)實際上是指來自不同來源的數(shù)據(jù),,包括社交網(wǎng)絡(luò)甚至手機等來源。他說:“這些數(shù)據(jù)正源源不斷地來自傳感器,、計算機和Web,。”
Harris指出,IT和業(yè)務(wù)部門對大數(shù)據(jù)的強烈興趣在于,能夠駕馭這些數(shù)據(jù),,實際上就是能夠分析這些數(shù)據(jù),。Mozilla的開發(fā)人員Christian Heilmann稱,關(guān)于大數(shù)據(jù),,好消息是我們積累了大量的信息,,我們擁有可利用這些數(shù)據(jù)的系統(tǒng)。例如,,分析人類基因組信息或者提供政府數(shù)據(jù)等,。通過租用一個小時的服務(wù)器使用Hadoop等技術(shù),商業(yè)分析能夠研究這些大型的數(shù)據(jù)集,。
由于廠商對此越來越重視,,那么他們開始采取行動以利用大數(shù)據(jù)就不足為奇了。Harris指出,,IBM最近用17億美元收購了提供數(shù)據(jù)倉庫設(shè)備的Netezza公司,。同時,Teradata將收購提供非結(jié)構(gòu)化數(shù)據(jù)高級分析和管理的數(shù)據(jù)倉庫廠商Aster Data,。
大數(shù)據(jù)所有權(quán)之爭
Heilmann把大數(shù)據(jù)看作是從網(wǎng)絡(luò)上收集的任何信息,,任何實時的數(shù)據(jù)。但是,,誰具體擁有這個數(shù)據(jù)呢,?他說:“這個問題存在很大的爭議。”
“我認為Facebook等網(wǎng)站讓用戶提供他們自己的信息,,卻不讓用戶知道他們正在收集分析這些數(shù)據(jù)的行為是是很危險的,。”Heilmann說。例如,,用戶可以上載自己喝醉的照片,,而他潛在的雇主至少在此后某一時間可以瀏覽這個照片。Heilmann強調(diào):“你從互聯(lián)網(wǎng)上刪除任何東西都是非常困難的,。只要你把它放到網(wǎng)絡(luò)上,,它就被存儲起來了。它將被復(fù)制到其他地方,。你應(yīng)該對于你放在網(wǎng)絡(luò)上的東西非常慎重,。”
Harris認為,這個數(shù)據(jù)的所有權(quán)取決于環(huán)境,。他說:“當然是生成這個數(shù)據(jù)的公司擁有這個數(shù)據(jù),。”他指出,雖然在網(wǎng)絡(luò)上有公共所有的數(shù)據(jù),,但是Facebook和Twitter擁有他們的用戶生成的數(shù)據(jù),。例如,,數(shù)據(jù)市場等大型數(shù)據(jù)概念已經(jīng)導致一些公司一次用1個月時間分析Twitter的數(shù)據(jù)流。
Cloudera的CTO Awadallah認為,,誰擁有非結(jié)構(gòu)化數(shù)據(jù)這一問題是很難回答的,。他舉例稱,例如蘋果應(yīng)用商店里的客戶采購信息就屬于蘋果公司,,雖然谷歌向用戶提供刪除數(shù)據(jù)的權(quán)利,,但是這些數(shù)據(jù)的所有權(quán)屬于谷歌。
相反,,遷移社交網(wǎng)絡(luò)數(shù)據(jù)的數(shù)據(jù)攜帶計劃(Data Portability Project)則認為,,用戶擁有他們自己的數(shù)據(jù),社交網(wǎng)絡(luò)應(yīng)該讓用戶方便地把自己的數(shù)據(jù)帶到其他地方,。該計劃的共同發(fā)起人,、Echo公司負責戰(zhàn)略的副總裁Chris Saad表示,這一努力的目標是,,讓網(wǎng)站披露當用戶把數(shù)據(jù)上載到網(wǎng)絡(luò)之后,,用戶能夠?qū)ψ约旱臄?shù)據(jù)做些什么。
Saad同時指出,,在一些案例中,,用戶同他們使用的在線服務(wù)共享自己數(shù)據(jù)的所有權(quán)和監(jiān)護權(quán)。他說:“這就像把錢放在銀行一樣,。雖然你擁有那些錢,但是你基本上是讓銀行為你保管,,并可能代表你使用這些錢,。”
這個問題不僅僅是隱私問題。“大數(shù)據(jù)”的定義之一就是,,從多個來源中分析數(shù)據(jù),,以便找出趨勢、商業(yè)機會,、市場變化,、潛在的客戶、客戶情感等許多事情,。當大數(shù)據(jù)工具分析網(wǎng)絡(luò)上的信息的時候,,他們真的有權(quán)在未經(jīng)擁有者許可的情況下這樣做嗎?
對此,,Saad說:“這實際上取決于具體情況,。如果你在公共互聯(lián)網(wǎng)上發(fā)表這些信息,那么我認為社會規(guī)則就是人們期待著自己的數(shù)據(jù)被提取,、分析,、索引和使用,。另一方面,當Facebook被視為一個私有網(wǎng)絡(luò),,并且讓你選擇哪些信息可以公開時,,這就有區(qū)別了,公開這些信息就違反了社會規(guī)則,。”
此內(nèi)容為AET網(wǎng)站原創(chuàng),,未經(jīng)授權(quán)禁止轉(zhuǎn)載。