相關文章

Edf1cb7058e925b97b6acad8a60fdf51 大約兩年前「大數據」這個名詞慢慢出現,一開始大家以為是個專有名詞,只要專家懂就好了。兩年過去,現在隨時隨地都可以聽到,市面上也有不少書籍在討論大數據。

作者=張雅鈞

阿里巴巴創辦人馬雲來台演講中就提到,未來的時代將不是IT時代,而是DT的時代,DT就是Data Technology數據科技,顯示大數據對於阿里巴巴集團來說舉足輕重。「數據科學家」也繼電腦工程師、數位行銷人才後,成為炙手可熱的職缺,每個公司都在找數據科學家處理公司內部的大數據,連美國政府也看到大數據的重要性,白宮聘請了前PayPal和eBay的執行官DJ Patil做為首席數據長,給予政府專業建議,該如何使用大數據。不只大企業、政府,連餐飲業都開始引進大數據技術,來幫助餐廳營運成長,包含菜單改善和數位化點餐系統,但究竟什麼是大數據?要多大、多少的數據量,才能夠稱的上是大數據?又它會怎麼影響我們的生活?企業和政府到底從哪裡取得數據資料?都是我們這期要探討的。

大數據究竟是什麼?

你一天會在Facebook上多久的時間呢?根據Facebook公布的資料,他們的註冊用戶在全球有14.9億,如果每一個人每天貼3次文、回應10次,這樣的資料量和訊息量非常的驚人,單用人工是無法蒐集每個用戶在網路上的意見,一定要透過電腦。類似這樣資料量非常巨大,單就人力也無法在合理的時間內,擷取、管理、運算,並且整理為我們能解讀的資訊,就被許多人稱作大數據(Big Data)。

4+1個V定義大數據

也因此有的學者會用「4V」來定義:Volume(容量)、Velocity(速度)、Variety(多樣性)和Veracity(真實性)。容量大、處理速度快、來源多樣性高的數據,同時具備真實性,並能創造Value(價值),可以讓大家在多種層面應用,就是大數據的特質。

數據大小沒有確切定義

那麼到底資料量要多大才能夠說是大數據?根據維基百科的定義,資料大小從幾TB(Terabyte)到幾PB(Petabyte)不等,不過目前為止,沒有一個準確的標準來界定大數據的大小,而資料的大小其實也不是大數據的重點,「有價值」才是大數據存在的意義。


Facebook有14.9億的用戶,其他像是WhatsApp、Instagram等服務也有不少使用者,更不用想像上面的資料量、訊息量有多少,過去這些訊息可能要靠紙本傳遞,有了網路資料量也快速成長,這些社群工具更可以透過資料的蒐集,更新服務更貼近使用者的需求。

大數據跟商業分析的差異


資料來源:Splunk、數位時代


▲大量、快速取得,來源多樣的資料,經過真實性考驗之後,擁有一定的價值,是大數據的核心架構。

 

 

下一頁與您更深入介紹大數據。

使用 Facebook 留言

發表回應

謹慎發言,尊重彼此。按此展開留言規則