大數據一點都不大?可能誤導你的決策?破解 Big Data 的 8 個迷思

資料分析學(data analytics)和「大數據」(Big Data)給予了人們徹底顛覆「行銷」的期盼。

大多數公司都從許多管道蒐集到大量的數據:包括:財務數據、行動數據、交易數據、顧客研究數據、行為數據、社群媒體數據等等。在新的分析技術、電腦運算能力倍增,以及線上資源即刻可得的推波助瀾下,更是催生出許多功能強大的工具,帶來了永久性的改變。

 

這些分析工具及技術的力量之大,已經使得分析學的應用範圍大大地延伸,不僅有助於開啟新的機會和策略,也開創了過往從來無法想像的可能性。

不過,分析「大數據」這件事,卻被講得太過簡單了。實際上,運用大數據還是一項亂無章法、非常勞力密集的工作

借用兩個真正在做這項工作的人所說的話:關於大數據的部分言過其實的宣傳,給我們帶來了麻煩,因為這形成了一個錯誤的期待,彷彿大數據有多麼簡單似的。

因此,我們可以開始務實地看待大數據,是時候該終止這些經常聽到的迷思了。

大數據迷思 1:大數據很大

大數據一點都不「大」(big),而是很多元(diverse)。 「大」頗有誤導之嫌。

我們所談論的其實是各式各樣來源的大量「數據點」(data point;一個資料集裡的一個可供辨識的要素,泛指一則資訊或一項事實),即時地、高頻率地在更新。它的性質非常細碎,可能是個人的交易數據:像是某張信用卡在某個加油站,被用來支付特定一筆油錢。

換言之,大數據實際上是巨量、海量的非常細小的數據。它不是一批有如土石流般傾瀉而下的數據;而是一場沙塵暴。在沙漠裡,陣陣強風所掀起的無數砂粒,可能會讓你眼盲、讓你失去方向感。

有鑑於此,想要在沙塵暴中看清楚,我們還需要破除哪些迷思?

大數據迷思 2:你必須立刻採用

生命中,大多數重要且有價值的事物,都是困難的,大數據的分析也不例外。想要解決這個難題,只能一小步一小步來,並且從非常清楚具體的目標著手。

在你動手囤積數據之前,請謹慎地思考你到底想要拿這些資訊做什麼?

大數據迷思 3:數據愈精細愈好

數據愈是即時、愈精細,總是愈好?不,一點也不。一場足球賽只看前四分之一,並無法預測整場比賽的結果。即時取得的資訊很可能因為為時尚早,而無法據以採取行動。有時候,你必須把時間拉長、把鏡頭拉得更遠,才能看得見全景,掌握事物的全貌。

大數據裡充斥著大量的雜訊(white noise)。隨著解析度愈高,好比說每分鐘而非每星期的數據,或是一個城鎮的規模而非一個州的數據,噪音占整體訊號的比例就會增加。

不要混淆了精準度(precision)和正確性(accuracy),兩者的差異有必要被釐清。大數據如果是在原始、四散的形式時,是有可能會誤導人心的;它需要集結到一個適當的程度,才能排除掉雜訊。

大數據迷思 4:大數據是好數據

「大量的數據」和「大量的好數據」是有差別的。

劣質數據裡有很多錯誤、很多遺漏的數據,是會造成誤解的。照片和影片可能會被標記錯誤,而青少年所寫的亂無章法的訊息,難道就足以反映出正面或負面的情緒?有時候,我們需要一個聰明的模型來釐清這一切。

為了正確解讀資料的意義,你必須丟棄某些資料。想要正確分析大數據,首要任務之一就是:你必須釐清,你打算將什麼樣的資料納入你的分析中,又必須丟棄哪些資料。

大數據迷思 5:大數據意味著「分析師」將變得異常重要

經常有人說,大數據將會帶來分析師(analyst)這項職業的興起,他們將成為「資訊時代的新寵兒」。不過,這種主張「資料分析團隊」(analytics team)即將崛起的說法,其實是被過度誇大了,因為資料增生速度的大幅提升意味著,人們現在根本就沒有時間去「向分析團隊做簡報」。

我們需要的是擁有更快速的工具,能夠因應數據新增的速度、數量和精細度。

理想狀況下,一小群專精的分析師,懂得善用科技的力量,讓企業或行銷人員能夠自行完成更多的資料分析、情境模擬和決策輔助。我們預估,資料分析部門(Analytics Department)將會消失,自助服務(self-service)將日益普及。資料科學家(Data Scientist)占據優勢地位的時代不會永久存在,因為數據實在是太多了!

大數據迷思 6:大數據能夠給你具體的答案

模稜兩可是大數據的主要特色。多重的數據來源(例如,交易、潛在顧客開發和媒體)可能會引導你偏離了證據所指的方向。不同的數據,如果未能正確地分析,確實可能會得出相互衝突的證據。你要選擇相信哪些數據?

大數據需要人去做判斷,去調停和解決看似彼此衝突的證據,而那正是技術高超的分析師可以施展長才之處。

 

你擁有的數據愈多,你就愈有可能遇到有待解析的矛盾和模糊。大數據沒有那麼萬能、強大;事實上恰恰相反。更多的數據可以給你更多的證據,卻不會讓你更貼近真相,除非你能夠靈活運用有經驗的人腦判斷,去調和這些相互衝突的證據。

資料分析學的未來就是:結合、權衡和判斷多重的資訊來源和不同的分析。

大數據迷思 7:大數據是一顆「神奇 8 號球」

(編按:神奇 8 號球指的是 Magic 8-Ball 這款玩具,外型就像撞球台上的 8 號球,使用者可以提出問題,搖晃球體後,會浮現出答案。可以用來占卜、尋求建議。)

嗯,這麼說也沒錯,但是你必須用非常正確的方式來問問題。這有點像是當一個精靈給了你 3 個願望,你得非常謹慎地措詞。

在應用資料分析學的時候,如果不夠精準或是事先沒有形成細緻的假設,反而會讓你誤入歧途,並且給出一個不正確的答案。手上握著「大數據」這個水晶球時,你要非常小心地發問。

大數據迷思 8:大數據可以建立自學的演算法

從行銷的觀點來看,參照「無架構、未管理的數據」(rogue data)所得出的錯誤推論,點出了自動化模型的局限:例如,從直接回應電視廣告(direct response TV ad;在廣告中直接號召觀眾撥打電話、傳真或寫信,以獲得產品樣本、目錄或直接購物)來預估客服中心的來電話量,結果勢必會產生誤差。

同理,從美式足球超級杯(Super Bowl)賽事周末所取得的「無架構數據」,也很有可能會扭曲一套自動更新的演算法。

演算法如果以正確的方式加以設定,確實可以發揮強大的功能,但是這其中總是需要人腦的介入。行動電話業者已經做出了良好的示範,將非行銷數據(non-marketing data)用於行銷用途:他們知道你的朋友有哪些人;他們可以猜測你的年紀;他們知道你出沒在城鎮的哪些地帶;他們知道你瀏覽過哪些網站;他們也知道你正在使用、還有在哪裡使用哪些 app(手機應用軟體)。

保險公司也可以使用無線遙測技術(telemetrics;針對相隔一定距離的對象進行檢測,並將結果傳送到接收地點)來取得數據,並用於行銷,而非只是承辦承銷保險。

基本上,釐清這些迷思的本意,是想排除以下的盲目信念:擁有數據,就可以確保企業成功。

真相是,大數據本質上就是一項工具,無異於電腦或智慧型手機,是一項很棒、能夠改變遊戲規則的工具,但是這項工具只有在交由懂得正確指令和座標的人使用時,才能發揮這樣的作用。