失業的辛普森詭論

失業的辛普森詭論圖╱美聯社

2020年各學歷失業率

最終統計,常是多組資料加總(或平均)的結果,例如大學錄取率,男生錄取率高於女生,直觀上會認爲有性別歧視,但還原加總前各組資料會發現,這並非歧視,而是多數女生選擇錄取率較低的文學院所致,各學院男女生錄取率並無差別,此即辛普森詭論(Simpson’s paradox)。

■辛普森詭論(Simpson's paradox)意指數組資料經綜合之後,可能會出現戲劇性變化,例如失業率是綜合了各年齡層的失業率而得,錄取率是綜合了各學院錄取率而得,各學院男女生錄取率平分秋色,各年齡層高學歷深具優勢,惟加總後的數字皆出現逆轉。

長期以來,臺灣一直流行「高學歷高失業率」的說法,拿起數據一覈對,還真是如此,這樣說來,書豈不是白唸了,何以念愈多書,失業率卻愈高?

不少人的解釋是,高學歷者找工作比較挑剔,因此失業率自然會高一些,這話雖有點道理,然而再怎麼挑,人總得生活,最後還得屈就,不可能一直失業下去,況且以1990年代大學生的身價,哪會找不到工作?如此高學歷又怎麼會高失業率呢?

高學歷高失業率一語流行於1990年代,那時期臺灣失業率約2%,而大學學歷失業率有時會到達3%,2000年以後情況更嚴重了,超過4%是家常便飯,自2009年以來年年超過5%,以去年而言,就高達5.5%。

失業率是綜合各年齡層

去年其他學歷的失業率如何?國中及以下學歷者2.8%、專科2.8%、高中職3.5%,皆遠低於具有大學學歷者,三十年來,高學歷高失業的情況依舊,雖然說念大學並非爲了找工作,但唸書期間所習得的學問、邏輯還是有助於就業纔是,怎麼會落得失業率居各學歷之冠?

事實上,多數人在解讀各學歷失業率時,都落入了辛普森詭論(Simpson's paradox)了,辛普森於1951年發現,在某些情況下,數組資料合併成一組資料時,可能會得出相反的結論。

各學歷失業率是綜合各年齡層失業率而得,而各學歷的年齡分佈大不相同,以大學學歷者而言,如今有四成分佈在15~29歲的年輕族羣,專科、高中職、國中及以下學歷者逾七成分佈在40歲以上,年輕人不多。

衆所周知,青年失業率是一般人的兩、三倍,這是因爲學子們甫踏入社會需要一些時間磨合,隨着年紀增長,失業率纔會漸次降低,值得注意的是,觀察30歲以上各學歷失業率,絲毫沒有「高學歷高失業率」的情況,非但沒有,大學學歷失業率反而是最低的。

以去年爲例,30~34歲這個年齡層,大學學歷失業率低於專科、高中職,以40~44歲而言,大學學歷失業率2.5%,專科2.9%、高中職3.1%、國中及以下3.7%,大學學歷者深具優勢。再看45~64歲,大學學歷者1.9%,續居各學歷最低,就業優勢更上層樓。

社會新鮮人需磨合期

惟有在15~29歲青年族羣,大學學歷者的失業率較高,這是因爲多念四年書,晚出社會所致,一般說來,這個年齡層專科、高職畢業生都已工作了七、八年,磨合期已過,而大學生甫走出校園,能量還在蓄積中,然而,過了而立之年,如前所言,高學歷就業優勢扶搖直上,失業率居各學歷最低。

既是如此,何以各年齡層的失業率一綜合,就出現「高學歷高失業率」?這是因爲大學學歷者高達四成人口分佈在15~29歲的年輕族羣,這麼高的比重分佈在高失業的年輕族羣,加總之後自然就陷入「辛普森詭論」,高學歷低失業遂變成高學歷高失業。

然而,隨着少子化,再過幾年當大學學歷人口不再那麼年輕,那時辛普森詭論就會消失了。