人文科普:預(yù)測(cè),為何有時(shí)會(huì)讓人大跌眼鏡?
發(fā)布時(shí)間:2021-01-04
瀏覽次數(shù):1760
人文科普:預(yù)測(cè),為何有時(shí)會(huì)讓人大跌眼鏡?

這是美國總統(tǒng)選舉史上一個(gè)真實(shí)的案例。這則案例告訴我們,由于一些隱含因素的影響,統(tǒng)計(jì)的實(shí)際結(jié)果和人們的預(yù)測(cè)是大相徑庭的。

1936年,美國羅斯福總統(tǒng)準(zhǔn)備競(jìng)選連任,他的對(duì)手是堪薩斯州州長蘭頓,大多數(shù)的觀察家都認(rèn)為羅斯福可輕易實(shí)現(xiàn)連任。因?yàn)榱_斯福和蘭頓當(dāng)時(shí)的競(jìng)爭背景是,美國正從經(jīng)濟(jì)大蕭條中復(fù)蘇,盡管全國仍有900萬失業(yè)人口,人民的實(shí)際收入比1929-1933年那段時(shí)期少了約1/3,但總體情況正處于慢慢好轉(zhuǎn)的態(tài)勢(shì)。

這無疑為羅斯福在任期間財(cái)務(wù)赤字的辯護(hù)提供了有利支撐,有誰不愿意這種良好的趨勢(shì)延續(xù)下去呢?所以剛剛成立的蓋洛普咨詢公司在調(diào)查了50000個(gè)樣本后, 便預(yù)測(cè)羅斯福會(huì)得到 56% 的選票獲勝。

預(yù)測(cè),為何有時(shí)會(huì)讓人大跌眼鏡?

喬治.蓋洛普,蓋洛普公司的創(chuàng)始人

圖源:google.com

但這個(gè)預(yù)測(cè)并沒有引起足夠重視,因?yàn)樵诋?dāng)時(shí)蓋洛普的名頭比起《文學(xué)文摘》 (Literary Digest) 雜志顯然要遜色的多。要知道,《文學(xué)文摘》在總統(tǒng)選舉的預(yù)測(cè)中素負(fù)聲望, 自1916年開始做預(yù)測(cè)以來未曾有一次失手,所以它的預(yù)測(cè)結(jié)果才是人們特別關(guān)注的。

在大眾的期待中,《文學(xué)文摘》雜志給出了預(yù)測(cè)結(jié)果:蘭頓會(huì)以 57% 比43% 大勝羅斯福。這可不是隨意的判斷,雜志依據(jù)的是從龐大讀者群中回收的高達(dá)約240萬份調(diào)查問卷的統(tǒng)計(jì)數(shù)據(jù),這幾乎可稱之為有史以來范圍最大的一次民意調(diào)查,無論如何都具有巨大和充分的說服力,有不同意見的少數(shù)觀察家也不得不保持沉默靜待結(jié)果。

預(yù)測(cè),為何有時(shí)會(huì)讓人大跌眼鏡?

1936年,預(yù)測(cè)蘭頓獲勝的《文學(xué)文摘》封面

圖源:mathcenter.oxford.emory.edu

可令大多數(shù)人意外的是,選舉結(jié)果卻是羅斯福以 62.5% 比37.5% 獲得壓倒性的勝利,正好與《文學(xué)文摘》的預(yù)測(cè)南轅北轍,而栽了大跟斗的《文學(xué)文摘》在總統(tǒng)選舉完不久就宣告破產(chǎn)。人們不禁好奇,此前從未失手的雜志此次何以會(huì)犯如此離譜的錯(cuò)誤?最后,統(tǒng)計(jì)學(xué)家為人們揭開了謎底——調(diào)查樣本偏差。

在科學(xué)嚴(yán)謹(jǐn)?shù)某闃诱{(diào)查中,樣本的挑選必須很公正,即必須涉及所有的可能范圍,才能獲得準(zhǔn)確有效的資訊。若在選樣過程中發(fā)生“選擇偏差”,即有排除 (或多取) 某一類樣本的傾向,那么依此進(jìn)行的統(tǒng)計(jì)判斷也極大可能發(fā)生偏差。《文學(xué)文摘》寄出的1千萬份問卷,去向是訂閱用戶、電話簿及一些俱樂部的會(huì)員,顯然這是特定和特殊的人群。1936年電話尚未普及 (平均每四戶才有一臺(tái)),此外,參加任何俱樂部者都要具備一定經(jīng)濟(jì)實(shí)力。

換句話說,這樣的抽樣過程存在排除窮人的傾向。在1936年以前, 這種選擇偏差對(duì)于預(yù)測(cè)結(jié)果沒有過多的影響, 因?yàn)楫?dāng)時(shí)富人與窮人的投票行為差異并不太大。但在1936年,因經(jīng)濟(jì)的因素,造成選民政治傾向有很大的分歧:窮人較多選擇羅斯福, 而富人則傾向支持蘭頓。這就造成了《文學(xué)文摘》的選擇偏差。不難看出,當(dāng)有選擇偏差時(shí), 樣本數(shù)雖多但不見得有效。

除了這個(gè)主要原因,《文學(xué)文摘》還犯了另一個(gè)嚴(yán)重的錯(cuò)誤:對(duì)于受訪名單缺乏全面盡心的反饋爭取。簡單地說,就是調(diào)查樣本中有過多沒有回復(fù)或作廢,也在一定程度上曲解了調(diào)查結(jié)果,這就是“拒絕(作廢)偏差”。

《文學(xué)文摘》對(duì)全國所發(fā)出的1千萬份問卷中,只有24%的回復(fù)。這24% 反饋者的意見,并不能代表全部被挑選選民的意愿。因?yàn)樵跊]有反饋回收的問卷中,許多人的本意與反饋者的意見可能有很大的差異。比如,《文學(xué)文摘》在芝加哥所發(fā)出的問卷數(shù),大約是芝加哥選民的1/3, 不可謂不多,但其中回復(fù)者僅有20%。

在回收問卷中,支持蘭頓的超過半數(shù),但選舉結(jié)果,羅斯福獲得芝加哥約2/3的選票??梢钥闯觯段膶W(xué)文摘》的問卷調(diào)查既存在選擇偏差,又存在拒絕偏差,導(dǎo)致調(diào)查預(yù)測(cè)結(jié)果錯(cuò)誤完全在情理之中。

就一般而言,低收入與高收入者中作廢(不回答)問卷的比例較高,這就導(dǎo)致在回收問卷里中收入者的比例遠(yuǎn)遠(yuǎn)超過事實(shí)比率。而中收入者的意見與高收入或低收入者不見得相同,所以這種中收入者占大多數(shù)的調(diào)查就存在明顯的缺陷,因此現(xiàn)代重大議題的民意調(diào)查,在條件允許的前提下,側(cè)重于成功率可達(dá) 65%的面訪,這比回收率常不到 25%的郵寄問卷更全面也更有效。

不過即使采用面訪,類似的偏差問題仍然存在,這就要求調(diào)查者對(duì)被調(diào)查者的工作類別、家庭狀況、社會(huì)背景等進(jìn)行詳細(xì)了解,盡可能采用巧妙合理的方法,解決偏差問題以提高調(diào)查的有效性和科學(xué)性。



關(guān)注【深圳科普】微信公眾號(hào),在對(duì)話框:
回復(fù)【最新活動(dòng)】,了解近期科普活動(dòng)
回復(fù)【科普行】,了解最新深圳科普行活動(dòng)
回復(fù)【研學(xué)營】,了解最新科普研學(xué)營
回復(fù)【科普課堂】,了解最新科普課堂
回復(fù)【科普書籍】,了解最新科普書籍
回復(fù)【團(tuán)體定制】,了解最新團(tuán)體定制活動(dòng)
回復(fù)【科普基地】,了解深圳科普基地詳情
回復(fù)【觀鳥知識(shí)】,學(xué)習(xí)觀鳥相關(guān)科普知識(shí)

聽說,打賞我的人最后都找到了真愛。
做科普,我們是認(rèn)真的!
掃描關(guān)注深i科普公眾號(hào)
加入科普活動(dòng)群
  • 參加最新科普活動(dòng)
  • 認(rèn)識(shí)科普小朋友
  • 成為科學(xué)小記者