對於民眾黨的民調為何失真,柯文哲終於作了答覆。他說每次民調都有公布原始數據,決不可能作假,選前評估是三足鼎立,民眾黨在市話部分是接近結果的,但因為市話的年輕樣本不足,所以必須加計手機民調。然後他認為最後結果失真,是因為年輕選民投票率不如預期,如果年輕人投票率高,結果就可能接近預測。
這樣的說法有道理嗎?簡單兩個字結論:鬼扯。而且進一步看,柯文哲的說法,也透露了民眾黨的民調確實是假民調,只是並非在數字上作假,而是在加權上作假。
首先要講的一個觀念,就是不論投票率高低,在各年齡層分布比例固定的情況下,年輕族群的投票率高低,其實並不會影響對於支持率的判斷。打個比方來說:
這次的選民結構,20到29歲和70歲以上都大約佔比15%,30到39歲和60到69歲都大約佔比16%,40到49歲佔比20%,50到59歲佔比18%。如果柯文哲在20到29歲的支持率市60%,30到39歲是50%,40到49歲是30%,50到59歲是20%,60到69歲、70歲以上是10%,那麼如果有600個選民,投票率百分之百,柯文哲將可獲得180票,得票率為30%。
如果賴清德各年齡層分別是30%、30%、40%、40%、40%、40%,那麼他將可獲得220票,得票率為36.67%。如果侯友宜的年齡分層支持度是10%、20%、30%、40%、50%、50%,那麼他的總得票數將是200票,支持率為33.33%。
但如果投票率不是100%,下降成70呢?那麼每人得票率將分別變成柯126票、賴154票、侯140票。每個人的得票率,依舊是30%、36.7%,和33.3%。
所以投票率高低,和民調評估根本沒有關係。只有在一個情況下有關。就是加權的範圍,除了傳統的地區、性別、年齡和教育程度,也把「各年齡層投票率預估」加了進去。
也就是說,依照民眾黨內參民調失真的情況以及柯文哲的講法,在他們的加權裡,很可能是把「年輕人投票率」放大了。而且,在年輕人其實人數並不佔多數的情況下,這個放大的值將非常可觀,才會造成「柯文哲支持率超過侯友宜、接近賴清德的結果」。
當然,民眾黨要把投票率預估放到加權裡不是完全不行。但在民調說明欄裡,對加權方法只有「依內政部最新人口資料,針對戶籍地、性別、年齡、教育程度採用多重反覆加權(Raking)」,並沒有「投票率預估」。所以如果放了年齡加權,就是造假。
其次,是根據洪永泰教授對2020年總統大選的研究,指出那一年年輕人的投票率是史上最高,大約是75%,過去大約都是60%到65%之間。要知道,這是在當年有反送中和「討厭韓國瑜」情緒下,才衝高的投票率,而且那一年整體投票率是74.9%,也就是說,在即使大幅衝高的情況下,年輕人投票率也不過和總投票率持平,絕無可能「大幅超越」。
好了,退一萬步,就算民眾黨真的認為柯文哲有如同「反送中」的吸引力,青年投票率提高到2020年一樣的75%,但今年投票率是將近72%,這個數字也不過高了3%,就算這3%全部灌給柯文哲,也不可能造成「柯文哲排名第二且接近賴清德」的失真結果。
如要造成這種結果,必定是不但大幅提高年輕人投票率的加權,同時也對賴清德和侯友宜在年齡分層佔優勢的投票率減權,才有可能。
如果是這樣,那這不是假民調,什麼才是假民調?
順便一提:民眾黨宣稱它們公布了原始數據,但其實他們的原始數據只有「各年齡層總數」的數據,並沒有「各年齡對每組候選人支持度」的原始數據。也就是說,很巧合的,這個很可疑的「年齡投票率加權」,並沒有呈現在他們公布的數字裡。
柯文哲只能嘴美麗島,但其實從數字上看,美麗島也比民眾黨內參民調準多了。至少不是和擲茭一樣。還有之前說手機民調才準,現在又說不準的原因是手機民調,但他們的市話民調很準。我真的不知道教徒要怎麼吞下這種說詞。