close


什麼是Google 式民調?簡單講,就是以候選人的名字為關鍵字,看搜尋引擎的頁面數,和競選對手比較,來預測誰可以當選的一種方法。

我曾經寫過好幾篇關於這方面的文章,比方:

Google式民調預測雲林立委補選結果:誤差不到1%!

馬英九為何當選?一年前就看的出來了

預測誰當選沒什麼了不起,預測當選者最後票數可以接近到1%之內才厲害。

這個方法有很多好處,比方說客觀,網頁數不會受調查者主觀的影響。(民調的問題和執行民調者的公信力可能就會)。

其次是便宜,只要利用網頁連上Google或Yahoo就能執行,成本等於零。

最後一點是人人都可以進行而且公開,懷疑結果的人,自已就可以進行一次運算。

但這個方法也不是沒有缺點,最大的問題是,我們不知道哪一種選舉要運用哪一種策略。比方說,在總統大選時,以台灣的網頁數這個單一結果最準。但是在雲林立委選舉時,這個方法卻失效,必需改用14種結果的平均才會接近真正的得票率。

會這樣,是因為選舉時候選人會進行各種網頁上的操作,某些網頁數目操作起來容易,某些卻很困難。投票的人越少,候選人選區越小,關鍵字網頁數也會比較少,這樣情況之下,也比較容易操作。

不過我進行了多次的研究,發現有一個定理:在越多搜尋策略項目中領先的候選人,當選的機率就越高。

怎麼說呢?

像Google的全球網頁數和台灣網頁數代表候選人在傳統選戰上投入的資源,這通常和財力成正比。而競選連任的縣長也通常在這方面領先,這是因為執政的優勢。

Google的臉部特寫圖片數和知名度有關。大家可以看上面那張表,圖片數比較少的候選人通常我們也不太記得他長什麼樣子。

新聞數和網誌數則和創造議題的能力有關。(上圖點兩下可進相本看大圖會清楚一點)。

如果一個候選人在各項數目上都領先的話,他本來就應該當選。

另外我也加了Plurk網頁數和Facebook的網頁數。由於民進黨在這兩個微網誌上的經營,你可以看見民進黨候選人通常在這兩個數目上都獲勝。

民進黨窮到跑沒路,但微網誌這塊卻經營的不錯,網路部真是做了不少努力啊。

我參考雲林選舉的分析,挑出裏面的5個數據(Google全球,Google臉部圖片,Google 新聞, Yahoo全球,Yahoo網誌)來平均得票的比率,當做這8個縣市的預測結果。

如果明天選,當選人分別是:

宜蘭:呂國華 (100%)

桃園:鄭文燦 (80%)

新竹:邱鏡淳 (90%)

苗栗:劉政鴻 (70%)

彰化:卓伯源 (80%)

南投:李文忠 (80%)

雲林:蘇治芬(100%)

嘉義的張花冠(50%)


各個當選人名字後面的是我估計的準確率。我自已的算法是,當選人如果在上面的7項數據中有一項沒有領先的,就扣10%。而PLURK和FACEBOOK各扣5%。

比方蘇治芬,不管你用哪一種檢索策略,她永遠在數字上遙遙領先。這樣選出來她一定是大勝。當時劉建國的預測結果還沒有她漂亮,可以說她一定會當選。

宜蘭的選情綠營也許有些期待,但用這個方法來看卻不是。連綠營其它縣市都大勝的PLURK數和FACEBOOK數目都沒有贏,我看接下來的這些日子要加緊努力了。

鄭文燦以些微的差距勝出,很多人大概覺得不可能。但是你看他在新聞和臉部圖片上的領先,表示他的製造話題能力和知名度較高,而吳志掦除了資源多其實並沒有太多優勢。

各個縣市幾乎都是有國民黨或民進黨支持的候選人網頁數目才會高,表示政黨的支持很重要。只有一個例外,就是新竹的張碧琴。So far她算選得很不錯了。

南投李文忠領先大概也有很多人訝異,不過我覺得不奇怪。有誰知道李朝卿長什麼樣子?但幾乎沒有人不記得李文忠那張臉。李文忠只有在新聞數上面輸現任縣長,其它都贏。

另外苗栗劉政鴻和楊長鎮的結果也很有意思,楊長鎮其實在GOOGLE網頁數上領先,但是劉政鴻在部落格上卻贏得非常多。這和其它現任縣長的情況剛好是相反的。

而張花冠也是贏在部落格。是不是因為有刻意經營這一塊呢??因為她其它的數字領先的不多,而且5個數字平均結果和翁重均差不多(43.7%比43.2%),所以我估出來確率才一半,這叫什麼預測啊,大概和丟銅板差不多。

其實現在還有兩個星期多的時間,做這個預測還太早,因為我發現關鍵字數目每天都變動的很快,表示選戰越來越激烈。候選人還有努力的空間。其實如果以劉建國那次的經驗應該是把14種結果都計算出然後平均的,但那實在太累。所以選前一天我才會做最後的估算。

這個一半的預測能幹嘛呢?

我給綠營的意見是:

蘇治芬不必選了,應該是全國得票率最高的,所以,跑去幫張花冠吧。然後全黨去幫鄭文燦,因為比率上很接近。

而李文忠呢,也很簡單,只要把綠營人士的投票率弄到和以前的選舉一樣就好了。因為被基本教義派視為背骨,有些人可能不願意去投票。做法上比方說李文忠去探視阿扁,或是阿扁表示支持李文忠。Anyway,阿扁牢也坐這麼久了,就大和解一下吧。阿扁表示支持李文忠是比較保險的做法,而李真的選上了阿扁也比較會快一點出來。我的理由寫在這一噗中。




這組結果在很多縣市和傳統的民調不一樣,我也沒辦法。這種算法不受主觀左右,只看數字,可說是冷酷無情。像我自已的判斷上覺得宜蘭綠營應該會贏的,所以別說你,連我自已都沒辦法接受這種預測。

過幾天再把剩下的縣市算一下。

arrow
arrow
    全站熱搜
    創作者介紹
    創作者 afutest10 的頭像
    afutest10

    afutest10的部落格

    afutest10 發表在 痞客邦 留言(0) 人氣()