close
縣市長選舉結果出來了,綠營算小勝吧,雖然只多一席宜蘭縣長,但重點是得票率大幅成長:
國民黨的47.8% 比 民進黨的45.3%,算起來是 1.0551倍。
網路可以預測這個結果嗎?其實不難。如果用總統大選時的計算策略,看民進黨和國民黨的關鍵字台灣網頁數目是這樣的:
國民黨 2350000頁比民進黨2340000頁,算起來是 1.004倍。
1.0551和1.004,雖不中亦不遠矣啊....所以藍綠勢力現在接近五五波就是了。
但是這個是不夠的,Google關鍵字網頁數,能預測縣市長誰會當選嗎?
我在之前的文章裏推算民進黨可能有6-10席,看來是大誤啊,實際上只有四席,到底問題出在那裏呢?我把最後的計算結果和真正票開出來的數字並列,來看看究竟是怎麼一回事?
這張表中,右側那列打o的表示是預測成功的縣市。
11月28日和12月5日表示選前的網頁數統計預測,算法是14種關鍵字比率平均,一周變化就是兩者相減。
我想了很久,覺得很奇怪。為什麼有些縣市奇準無比(不光是預測當選,連得票比率都很接近),有些縣市卻非常不準?
看來看去,我終於悟出一個道理了,那就是:必需要在人口比較大的縣市,這種網頁預測法才會準確。
上面中有紅色格標記的五個縣市,是這次選舉中人口最多的縣市,這五個縣市,全部都預測正確。
桃園有193萬人口,預測鄭文燦的得票率只差0.9%,吳志揚只差1.5%
彰化有131萬人口,預測翁金珠只差 0.52%,卓伯源只差 3.42%
另外你可以看雲林,嘉義,屏東,誤差值都在5%之內。
除了數值接近,得票順序和平均數的順序也都一致。這絕非巧合,關鍵字網頁數是真的和選舉得票數相關的。
只不過,要在大區域的選舉中,這個算法才會準確。之前總統選舉,誤差不到1%,因為是上千萬人的選區,後來算劉建國的得票率也很準,也因為是在雲林這種人口比較多的縣之中。
現在我們知道了,這種方法要準確,選民數必需在55萬人以上才比較準。
選民數比較少的,網頁關鍵字的的抽樣方式計算方法之所以會有誤差,我猜測是下列幾個原因:
1。候選人在網路上下的功夫大於對手很多,因為基本的網頁數不大(base不大),所以自已多弄出來的網頁就會改變原有的比率而讓計算失真。像楊長鎮的網頁數是55%,實際得票是33.6%就是一個好例子。他在網路戰上的確下了不少功夫。
2。候選人原先知名度不高,或選情本來不樂觀。但是後來選的很漂亮,選票比率一下子衝高,但是來不及反映在網頁數目上。這個例子就是林聰賢。他在選前沒有一項網頁數是領先的,但最後以54.20%勝出。他的網頁數在一周之中成長了17.25%,是所有候選人中最多的。林聰賢這一仗可以說是打得非常漂亮,選舉策略非常成功,應該可以算是經典案例了吧。
3。比較小的選區,賄選的影響力也會比較大,這也是讓網頁式民調不準的原因。
4。候選人本來就是媒體寵兒,所以關鍵字網頁數高,但因為選舉策略,讓後來的結果有差別。兩個好例子就是鄭文燦和李文忠。鄭文燦的知名度高,他的關鍵字網頁數因此非常高。他的對手吳志揚網頁數也不低,但是人家的部落格和網路可以有心的經營了兩年以上才有的成績,鄭文燦空降2個月就打出很漂亮的一戰。他的例子告訴我們,像桃園這麼大的選區(193萬人),派系,組織經營,地方上的交陪,到處插旗子其實沒那麼重要,候選人本身才重要。像人口比較少的南投(53萬人),李文忠就不好施展拳腳,他的網頁數和得票比率差蠻多的。
這讓我想到一點,就是一個人的人際關係再怎麼擴展,也有極限。比方每個人好好經營如果可以影響2萬人的話,在南投這種當選只要13萬票的地方就會有決定性的差異,但是在桃園當選要快40萬票的地方2萬票的幫助就不大了。李文忠和鄭文燦都是空降的,他們的選舉結果的差異可以讓我們了解到這點。另外,李文忠或許沒有得到綠營的全力支持我想也有關吧。
雖然席次我沒有猜到,不過之前文章中的這段話倒也有幾分正確性吧:『蘇治芬不必選了,應該是全國得票率最高的,所以,跑去幫張花冠吧。然後全黨去幫鄭文燦,因為比率上很接近。』
蘇治芬的得票率是65.37%,是全國最高的沒有錯。但張花冠其實不必幫。桃園的鄭文燦如果真的得到大力幫忙是有可能選上的(票只少6.7%)。
3+1的選舉結果,並不難猜測。有沒有辦法事先知道一些更細的狀況,而讓資源做更有效的分配,多上幾席,這樣預測才有意義啊。
像是澎湖(票少1%)和台東(票少5%),真的票開出來才知道差這麼少,但用Google式民調完全沒有猜到。早知道的話,綠營在這兩個地方多拼一下,也是非常有可能會上的。國民黨票數只多 2%卻能比民進黨多8席,應該是因為情報比較正確,所以比較能險勝吧。
早知道,大家都會說,千金難買早知道。這種網頁式民調的好處是實在太容易做成本又非常低,如果能用這個方法悟到一點點『千金』都難買到的『早知道』,就很值得了吧。
國民黨的47.8% 比 民進黨的45.3%,算起來是 1.0551倍。
網路可以預測這個結果嗎?其實不難。如果用總統大選時的計算策略,看民進黨和國民黨的關鍵字台灣網頁數目是這樣的:
國民黨 2350000頁比民進黨2340000頁,算起來是 1.004倍。
1.0551和1.004,雖不中亦不遠矣啊....所以藍綠勢力現在接近五五波就是了。
但是這個是不夠的,Google關鍵字網頁數,能預測縣市長誰會當選嗎?
我在之前的文章裏推算民進黨可能有6-10席,看來是大誤啊,實際上只有四席,到底問題出在那裏呢?我把最後的計算結果和真正票開出來的數字並列,來看看究竟是怎麼一回事?
這張表中,右側那列打o的表示是預測成功的縣市。
11月28日和12月5日表示選前的網頁數統計預測,算法是14種關鍵字比率平均,一周變化就是兩者相減。
我想了很久,覺得很奇怪。為什麼有些縣市奇準無比(不光是預測當選,連得票比率都很接近),有些縣市卻非常不準?
看來看去,我終於悟出一個道理了,那就是:必需要在人口比較大的縣市,這種網頁預測法才會準確。
上面中有紅色格標記的五個縣市,是這次選舉中人口最多的縣市,這五個縣市,全部都預測正確。
桃園有193萬人口,預測鄭文燦的得票率只差0.9%,吳志揚只差1.5%
彰化有131萬人口,預測翁金珠只差 0.52%,卓伯源只差 3.42%
另外你可以看雲林,嘉義,屏東,誤差值都在5%之內。
除了數值接近,得票順序和平均數的順序也都一致。這絕非巧合,關鍵字網頁數是真的和選舉得票數相關的。
只不過,要在大區域的選舉中,這個算法才會準確。之前總統選舉,誤差不到1%,因為是上千萬人的選區,後來算劉建國的得票率也很準,也因為是在雲林這種人口比較多的縣之中。
現在我們知道了,這種方法要準確,選民數必需在55萬人以上才比較準。
選民數比較少的,網頁關鍵字的的抽樣方式計算方法之所以會有誤差,我猜測是下列幾個原因:
1。候選人在網路上下的功夫大於對手很多,因為基本的網頁數不大(base不大),所以自已多弄出來的網頁就會改變原有的比率而讓計算失真。像楊長鎮的網頁數是55%,實際得票是33.6%就是一個好例子。他在網路戰上的確下了不少功夫。
2。候選人原先知名度不高,或選情本來不樂觀。但是後來選的很漂亮,選票比率一下子衝高,但是來不及反映在網頁數目上。這個例子就是林聰賢。他在選前沒有一項網頁數是領先的,但最後以54.20%勝出。他的網頁數在一周之中成長了17.25%,是所有候選人中最多的。林聰賢這一仗可以說是打得非常漂亮,選舉策略非常成功,應該可以算是經典案例了吧。
3。比較小的選區,賄選的影響力也會比較大,這也是讓網頁式民調不準的原因。
4。候選人本來就是媒體寵兒,所以關鍵字網頁數高,但因為選舉策略,讓後來的結果有差別。兩個好例子就是鄭文燦和李文忠。鄭文燦的知名度高,他的關鍵字網頁數因此非常高。他的對手吳志揚網頁數也不低,但是人家的部落格和網路可以有心的經營了兩年以上才有的成績,鄭文燦空降2個月就打出很漂亮的一戰。他的例子告訴我們,像桃園這麼大的選區(193萬人),派系,組織經營,地方上的交陪,到處插旗子其實沒那麼重要,候選人本身才重要。像人口比較少的南投(53萬人),李文忠就不好施展拳腳,他的網頁數和得票比率差蠻多的。
這讓我想到一點,就是一個人的人際關係再怎麼擴展,也有極限。比方每個人好好經營如果可以影響2萬人的話,在南投這種當選只要13萬票的地方就會有決定性的差異,但是在桃園當選要快40萬票的地方2萬票的幫助就不大了。李文忠和鄭文燦都是空降的,他們的選舉結果的差異可以讓我們了解到這點。另外,李文忠或許沒有得到綠營的全力支持我想也有關吧。
雖然席次我沒有猜到,不過之前文章中的這段話倒也有幾分正確性吧:『蘇治芬不必選了,應該是全國得票率最高的,所以,跑去幫張花冠吧。然後全黨去幫鄭文燦,因為比率上很接近。』
蘇治芬的得票率是65.37%,是全國最高的沒有錯。但張花冠其實不必幫。桃園的鄭文燦如果真的得到大力幫忙是有可能選上的(票只少6.7%)。
3+1的選舉結果,並不難猜測。有沒有辦法事先知道一些更細的狀況,而讓資源做更有效的分配,多上幾席,這樣預測才有意義啊。
像是澎湖(票少1%)和台東(票少5%),真的票開出來才知道差這麼少,但用Google式民調完全沒有猜到。早知道的話,綠營在這兩個地方多拼一下,也是非常有可能會上的。國民黨票數只多 2%卻能比民進黨多8席,應該是因為情報比較正確,所以比較能險勝吧。
早知道,大家都會說,千金難買早知道。這種網頁式民調的好處是實在太容易做成本又非常低,如果能用這個方法悟到一點點『千金』都難買到的『早知道』,就很值得了吧。
全站熱搜
留言列表