close


『 做民調要幹嘛?商人要押寶送錢,公務人員要看風向,小政客們決定要不要叛逃,媒體從業人員要唬人,網友要吵架筆戰,中間選民要西瓜偎大邊。民調,實在是台灣民眾居家旅行,殺人放火不可或缺的常備良藥啊~~』(引自 2008年總統大選目前Google民調結果:馬英九小贏,但接近五五波)

這句話實在有點cynical(犬儒)。預測未來,總是件讓人好奇的事情。2008年1月12日的台灣立委選舉,遇上這Web 2.0的時代,也有不少網站想以新的網路工具和方法取代傳統的民調方式探測水溫。比方:

1。Yahoo新聞的2008立委選舉:

http://tw.election.news.yahoo.com/l08/
這個號稱是台灣Yahoo『今年最好的服務』。它的特色是有所謂的『立場量表』,方便網友了解自已的立場和各個政黨的相近程度。



還有政大弄的:

2。未來事件交易所:

http://nccu.swarchy.org/
這是利用期貨的概念來預測立委候選人的支持度。



中國時報網站的:

3。拒絕爛立委,反推薦運動:

http://sayno.chinatimes.com/
用投票的方式讓網友推薦或反推薦立委候選人。


先說1。Yahoo新聞的2008立委選舉,以Yahoo的流量,應該有不少網友上去利用這個服務。它的網頁上說了:『目前一共有7207位不重複使用者提供了立場資訊,但為了避免在選前影響選情。我們將會再擇期公布,敬請期待,謝謝。』我倒是很期待這份調查報告的結果,和真的票開出來之間的差異。

2。未來事件交易所:這個網站利用的是期貨的概念,所以『西瓜偎大邊』的效應很明顯。比方說我明明支持『綠黨』或『紅黨』,也會投給他們,但我知道了解他們當選的機率很低,在這個網站上就不會買他們當選的合約。因此要靠這種方式預測當選人,還需要觀察。

3。拒絕爛立委,反推薦運動 :這個網站則是完全偏藍。點進去才知道其實不只反推薦還有推薦。網站掛名是『學者』主持,不過Google一下就知道都是國民黨的『智庫』。不必觀察,這個擺明了是助選用網站,結論必然不準,打鎗。

這些網站,和傳統的民意調查一樣,應該設入了不少時間和人力。小小部落客要怎麼提出數據和他們在web 2.0時代中競爭啊??

可以啊,別忘了我的大老闆是Google。(平均一個月發我1000元的薪水啊~~),Yahoo,政大,中時,在我們家大老闆面前都是小角色啦~~


Google式民調,簡單講就是看關鍵字的網頁數。特別是『台灣的網頁數』,來看候選人的『網頁可見度』。這和真正的投票結果當然不同。不過,在現有的方式中,電話調查,問卷填寫,期貨合約概念,網友投票推薦/反推薦,加上我這個『Google式民調』,誰才是『王道』呢?

別告訴我你的親朋好友都會投誰,這種菜市場調查法,完全上不了檯面。

票沒開出來,誰也不知道到底那一種預測方法準。科學的方法,就是先記錄下來這幾種方法的數字,等到真正結果出來的的時候再來比對。

反正都是推測,投票是法律保障的秘密行為,不管任何一種方法都必然有其限制和偏差。Google式民調卻有其它方法不及的好處,包括方法公開,人人可進行,成本超低,沒有立場影響結果的問題,而且,數據上很很難動手腳。

執行的方法如下:

1。先至中選會網站,http://www.cec.gov.tw/files/0961120/0961120.htm,取得候選人名冊。

2。以候選人名稱為關鍵字,查詢在google上的台灣 的網頁網頁目。比方查"高建智":



3。所有候選人查詢完了之後,決定選區中『最高票』的當選人。

過程講起來很簡單,不過其中有幾個問題:

1。『菜市場名』的問題。有些名字很多人用,雷同的人太多了,造成網頁數太高的假象。或是剛好這個名字有另一個網路名人。這種問題,在決定當選人的時候,以人工的方式排除。

2。兩個字的名字,和四個字的名字網頁數也會太高。前者一樣以人工排除,後者加上"xxxx"雙引號再查詢一次。

3。立委候選人高達297人,一個一個用手工查會累死人。我是用iMacro在Firefox上的外掛,寫一小段程式來重覆執行。在查詢到250次左右,google還以為是病毒在攻擊,跑出圖片碼認証。真是疑心病重的大老闆啊~~

一番努力之下總算跑完了,我把各選區得『票』最高的作成表如下:





表中的數字部份就是網頁數目,紅色表大幅顉先,(超過第2名40%)以上,黃色表差距不大,根據這個結果,統計各政黨得票如下:



結論是兩黨差不多,但如果把台聯算進去,泛綠還小勝。

沒有政黨推鑒的可能有7~5人當選。

因為結果太多了,我只把台北市的列出來:



這樣的結果,我自已有一些懷疑的地方:

1。泛綠的票,有這麼多嗎?

2。有負面知名度的一些候選人,如林進興,顏清標等,是否真能大幅勝出呢?



3。余天領先的幅度驚人。如果他當選,以後都找藝人來選就好了。



4。基隆的王醒之(王拓之子,但現在是綠黨),網頁數非常多,Why??



這一切都只能等票開出來才知道了。開票前一天,我會再跑一次程式,不過我想結果應該差不多。

我是台北市第8選區的,還有一個最大的問題,就是:『方景鈞』老伯伯,您,到底還要選幾次啊??



PS.方景鈞:

『好一個熱血的漢子!

這陌生的名字,google下去卻大驚失色-台北竟還有這一號人物?不得了,光是學歷就嚇死人:高中畢業後唸了四年中興、兩年商專、三年工專、四年政大和 五年的台大法律!國高中不算,他唸了十八年的書,甚至現在還在空中大學進修,太扯了吧!還自稱是「方氏超強抗震樑柱結構方法」的發明家,這是漫畫裡才會出 現的發明吧…

經歷也不得了,選了二三十年的公職人員,每役皆敗,為了選舉散盡家財,卻仍是堅持再戰,戰到了七十幾歲還不肯放棄!』
(引自 http://wraecca.info/archives/25)

(p.s.)
公職人員選舉罷免法 (民國 96 年 11 月 07 日 修正)
第   53    條
政黨及任何人自選舉公告發布之日起至投票日十日前所為有關候選人或選
舉民意調查資料之發布,應載明負責調查單位或主持人、辦理時間、抽樣
方式、母體及樣本數、經費來源及誤差值。

政黨及任何人於投票日前十日起至投票時間截止前,不得以任何方式,發
布有關候選人或選舉之民意調查資料,亦不得加以報導、散布、評論或引
述。
負責調查單位或主持人:billypan
辦理時間:如網頁所載
抽樣方式:網路網頁數
母體及樣本數:google搜尋台灣的網頁/google搜尋台灣的網頁
經費來源及誤差值:依連上google server有所不同,約在5%內

arrow
arrow
    全站熱搜

    afutest10 發表在 痞客邦 留言(86) 人氣()