星島日報

【專題】評估選情更準確 大數據有力取代民調

2020-11-19 08:28
美國總統大選仍未有最終結果,但從兩名候選人得票率分析,今年的選舉民調似乎重複上屆總統大選的錯誤,大幅低估特朗普的支持度,坊間認為,大數據分析有能力取代民調,更準確評估選情。IT專家指出,社會兩極分化既令民調回應率低,又增加受訪者說謊機率,惟數碼足迹難以造假,可信性高,更可反映即時民情,不會有民調數據滯後的問題。亦有業界嘗試整合數十家民調機構的調查結果,按機構往績提煉出最精準的資訊,從而評估候選人勝出機率,並認為民調與大數據可互補不足。 記者 郭增龍

四年一度的美國總統大選全球矚目,根據民調分析機構FiveThirtyEight指出,截至十月底,民主黨參選人拜登的全國民調平均支持率比共和黨參選人特朗普高百分之九點一,然而,這場從民調看來是毫無懸念的選舉,最終演變成勢均力敵的較量,有關鍵州份更要重新點票,令官方結果遲遲未能公布,再一次令人質疑民調失去可信性。

政治兩極 選民說謊礙可信性

  時事評論員梁啟智指出,就結果而言,民調機構成功推算十二個關鍵州份當中十個的勝負,但從勝負差距來說,個別州份似乎重複上一屆的明顯偏差,其中以威斯康星州最為嚴重。他認為,民調回應率愈來愈低,使民調工作變得困難,而高度兩極化的政治環境,有可能減低特朗普支持者回答民調的意欲,加上在疫情下,民主黨的支持者較願意響應減少外出的呼籲,亦可能變相增加他們回答民調的機會,這一系列的原因使民調高估民主黨的支持度。

  ASIAM數據分析及策略總監李鴻彥認為,民調準確性下跌源於受訪者向民調說謊,他形容在二元對立的社會下,公眾往往會先評估民調機構的立場,再調整答案,部分網上民調更出現大批網民空群而出,干預結果的情況。基於以上的問題難以解決,他認為通過大數據分析選情,將會比民調更準確,「大數據是分析使用者在搜索引擎尋找的關鍵字,一個人不會無目標地搜索關鍵字,亦不會意識到需要通過數碼足迹來造假。」此外,傳統民調的樣本亦遠較大數據少,「民調用電話、街頭訪問幾千人,大數據可以在美國一個州份,收集到五十萬人的數據。」

  縱然近年不時有人組織「網軍」試圖左右網上輿論,不過,洞視科技創辦人陳敬倫指出,大數據分析可將相似度高的資訊視作雜訊去除,待提煉出有用資料後再作分析,反觀傳統民調則無有效機制處理。

應整合民調兼重「厚數據」

  李鴻彥過去亦有分析本港選舉,包括在去年區選前一日,預測投票率可達六成九,以及當投票率達七成後,建制派的優勢將會消失,最終該次選舉投票率逾七成一,非建制派取得八成議席。他解釋,其分析方法不止側重傳統大數據分析所採用的數據比較,更着重「厚數據」,即是能夠帶出社會和文化意義的大數據。他以去年反修例風波為例,特首在「六.一六」遊行前宣布撤回條例,輿論預計遊行數字將會大減,惟他發現除了「遊行」及「維園」的搜尋量急增,「白花」或「花店」的搜尋量亦有同樣的情況,反映不少港人有意悼念早前墮樓的男子梁凌杰,「如果只知大數據而不知厚數據的話,會認為網上搜索『白花』或『花店』的資訊只是巧合。」

  就大數據分析民情的限制,李鴻彥指出,長者使用互聯網的機會較少,未必有足夠數據分析長者情況,建議未來民調增加訪問長者的數目,以補充大數據未能覆蓋的年齡層。

  除了通過數碼足迹評估選擇,有數據專家嘗試以整合民調方式,減低民調誤差。英國華威大學數學系博士鄒宇熙過去有通過數據分析本地政黨的選舉分析,是次美國大選,他整合過去五個美國選舉周期均有進行民調的數十家機構,製作概率模型,並在投票前三日,估計特朗普的勝率不足四分之一。他解釋,其概率模型考慮民調機構的往績、樣本數量及系統誤差數據,再加入近年選舉出現的隱藏保守派選民情況,調整民調誤差值。

欠誤差值數據變主觀解讀

鄒宇熙認為,每一個民調機構都有一定的誤差,但正因為民調擁有標準化方式計算出誤差值,令統計學家可通過數學模型,按民調的往績整合數據,提煉出精準的資訊。相反,利用大數據預測選情的方法,各機構的做法均有不同,難以像民調一樣,提供誤差值數據,最後令大數據分析的結果,成為主觀解讀多於利用科學方法所印證的結果。

他續說,近十年人工智能的發展,足以分析某些議題在網上的散播速度及正負面情緒,因此參選人通過大數據分析,可針對選民熱議的話題發表意見,促進與選民的溝通,但仍未足以估計賽果,「要有頻繁的事態及可以標準量化的數據,才可以發揮人工智能的優勢,但美國選舉兩年一次,限制很大。」

事實上,美國數據分析公司IGC研發的LUX election2020平台,亦是利用大數據了解美國人對兩位候選人的觀感,並發現有一半選民對特朗普抱有強烈負面情緒,從而評估他難以勝出選舉,不過,IGC強調平台並非正式選舉預測,只是民情監測。對此,香港民意研究所主席鍾庭耀認為,大數據分析配合混合模式的民意調查,似乎是大勢所趨,惟現階段大數據分析創意不少,但實效存疑,似乎仍然未成氣候,尚未能與民意調查爭長短。

每日雜誌

最新回應

關鍵字

熱門文章