200萬高考生被張雪峰改變

作者:chenqin
來源:城市資料團
文章已獲授權
有史以來報考人數最多的2024年高考即將出分,全國1300萬考生即將進入志願填報環節。而在近兩年的志願填報中,考生和家長們很難避開的一個人物便是——張雪峰
儘管早已作為考研老師成名,但張雪峰真正爆紅全網,還是在上一個高考季。下圖顯示從2019年到2023年的高考季期間,“張雪峰”一詞的抖音搜尋指數,2023年達到了2022年的11倍,2021年的34倍,更達到了2020年和2019年的200-300倍。
在2023年高考志願填報期間,他的影片切片也隨處可見,屢有驚人之語並衝上各大媒體熱搜,比如“孩子報新聞就打暈拖走”,“普通家庭女孩不要讀金融”等。鐵口直斷的風格以及明確的建議與指向,受到不少家長的歡迎,同時也引發了社會關於專業選擇和就業前景的廣泛討論。
那麼,張雪峰的爆火和他的言論,真的對高考錄取產生影響了嗎?網路言論到底會在多大程度上改變家長和考生的決策呢?
使用2017年到2023年共7年的高考錄取資料,我們進行了一項研究。

張雪峰點名的專業,錄取位次確實出現了下降

在每年高考前後,考生們總能拿到一本厚厚的志願參考書,給出了近一年或者幾年高考的錄取情況,其中包括每一所學校、每一個專業的錄取最低分以及平均位次。
要檢查每一個專業的相對熱門程度是否變化,最簡單的方式就是計算該專業每一年的平均錄取百分位
將每個專業的最低分在總體考生分佈中所處的位置,代表了這個專業的“錄取百分位”,例如90%的錄取百分位表示該專業最低錄取分數的名次高於90%的考生。再將所有學校、專業的“錄取百分位”按照專業求平均,便得到了每一個專業的“平均錄取百分位”。

將同一個專業在不同年份的錄取百分位相比,便能知道這個專業的錄取情況發生了什麼變化。平均錄取百分位越來越高,說明這個專業能招收到的考生排名越來越靠前。下圖列出了從2017到2023年這七年間四個典型專業的錄取百分位變化:

可以看到,數學類專業的錄取位次在不斷提升,已經比2017年提升了4到5個百分位。計算機類從2017到2021年的錄取位次有所下降,但2022和2023年再度提升。金融學類自2017年起錄取百分位就在下降,和數學類走勢相反,已經比2017年低了4個百分位。新聞學原本保持了穩中有降的趨勢,但是2023年出現了大幅度下降,降幅比起之前的六年更大。

2023年相對於2022變化錄取百分位變化最大的專業如下兩圖所示:

美術學類公安學類兵器類生物醫學工程類動物醫學類等專業,相對2022年錄取百分位大幅度提升。美術學、公安學和兵器類,提升幅度都超過5%——相當於在100名考生當中,該專業原本只能錄取到第N位,現在可以錄取到第N-5位。
天文學類經濟學類圖書情報與檔案管理類藝術學理論類基礎醫學類的錄取百分位下降最快。新聞傳播學類金融學類的降幅也在2%,進入下降最快的專業行列。
所以,張雪峰點名的新聞學和金融學專業,確實在2023年高考招生中出現了較大幅度的下降。

專業錄取位次變化,和張雪峰有多少關係?

但是,新聞/金融等專業的平均錄取百分位下降,和張雪峰有沒有關係呢?在2023年各校放榜後,我們不難發現類似這樣相互矛盾的言論——
財經類的專業錄取下降有目共睹,但是其中張雪峰起到了多少作用,大家意見並不一致。有人認為是張雪峰的影響直接改變了考生家庭的認知,使他們避免選擇某些專業;另一些人則認為,即使沒有張雪峰的言論,考生們的選擇也不會有什麼不同,張雪峰的言論只是當前錄取變化的註釋,並非原因。
到底誰是對的呢?我們首先可以回答這樣一個問題——張雪峰影響力更大的地方,這些專業的平均錄取百分位是否有了更大的變化?
為了識別張雪峰的影響,我們從抖音的星圖平臺獲得了張雪峰的直播觀眾分佈。將該分佈與各地區2022年末人口放在一起,可以畫出下面的散點圖。
上圖的橫座標為各地區人口,縱座標為張雪峰直播觀眾在各地區的分佈。可以看到,各地區張雪峰觀眾的比例存在一定程度的差異。
——圖中靠近右下角的點,觀看張雪峰直播的人口占總人口比例較低,比如貴州、廣西、雲南等。
——靠近左上角的點,例如天津、山東、吉林等地,觀看張雪峰直播的比例較高。
不同地區觀看張雪峰直播的人口密度差異較大,較高地區可以達到較低地區的5倍之多。我們把直播觀眾佔總人口的比例稱為“張雪峰密度”,用它來表徵張雪峰在不同地區的影響力差異。
將各地區的“張雪峰密度”,和各地區2023年的金融學、新聞學專業的錄取位次下降放在一起,可以得到下面的散點圖:
以上兩圖的橫座標均為“張雪峰密度”的對數值,縱座標為各省2023年的新聞學和金融學專業的錄取百分位相對於2022年的變化。(圖中的科類已經對應了最新的地方高考改革,例如黑龍江-物理實際上指的是2023年的黑龍江-理科,下同)
不難看到,新聞學和金融學的平均排位變化,都與這些地區的“張雪峰密度”呈現顯著的負相關關係,其中新聞學的負相關顯著性為0.047,金融學的負相關顯著性為0.007。因此,張雪峰觀眾越密集的地方,2023年新聞學和金融學專業的平均錄取百分位下降更多,這個命題完全正確。
但是這樣的相關性,不足以確定張雪峰是否真的對志願選擇存在直接的影響。因為有這麼一種可能,不是因為看了張雪峰直播,家長和考生才不選新聞學/金融學,而是本來就不喜歡新聞學/金融學的家長和考生,更有可能成為張雪峰的粉絲
很容易就能發現,相比於西南地區(廣西、雲南)的觀眾,北方觀眾(天津、吉林、河北)看張雪峰更多。這種差異可能來自許多因素,比如經濟社會環境的不同,語言習慣的差異,以及對不同職業、行業的認知態度差異等。
如果是這些地區上的差異,導致某些地區的考生本來就不願意選擇金融/新聞專業,那自然就會與張雪峰的相關議論產生共鳴,更多觀看張雪峰的影片。在這種機制中,上圖中“張雪峰密度”和新聞學/金融學的錄取百分位變化的負相關性也同樣會出現。
為了排除這種因素,最簡單的方式,是檢驗上圖的負相關現象是否在張雪峰爆紅(2023年)之前就出現了。下圖給出了2022年的結果:
可以看到,在2022年,各省的金融學/新聞學錄取平均百分位變化和“張雪峰密度”之間不存在統計上的顯著關係。也就是說,不同地區的“張雪峰密度”,在張雪峰爆紅之前,和這些地區的新聞學和金融學專業的錄取百分位變化並沒有關係
張雪峰密度,只在2023年才和專業錄取變化相關,但在2022年時並不相關,這排除了前面說到的這種“某些地區原本就不喜歡金融/新聞因此才與張雪峰有共鳴”的可能性——“張雪峰密度”較高和較低的地區之間,對金融學/新聞學專業的好惡原本是沒有顯著差異的,在張雪峰爆紅後,這樣的差異才出現。
因此,在金融學和新聞學專業上,張雪峰的影響,是確實存在的。在張雪峰密度最高的地區中,2023年金融學和新聞學專業的錄取百分位平均降低了4%

張雪峰影響了多少專業?

上文提到的新聞學和金融學,只是張雪峰最為廣泛熱議的言論中提到的兩個專業。張雪峰的直播中,避雷或推薦的專業遠不止這兩類,難以一一記錄。那麼,我們應該如何確定張雪峰的言論到底影響了哪些專業的報考呢?
參考上面驗證金融學和新聞學的方法,我們可以對2017到2022年每一年,計算每一個專業在各地區的報考名次變化的該地區的“張雪峰密度”的相關性,再使用2023年資料做同樣的相關性計算。如果某個專業的錄取存在和“張雪峰密度”的相關性,我們稱該專業存在“張雪峰效應”
如果某專業在張雪峰爆火之前就存在了所謂的“張雪峰效應”,那麼只能說明是地區特徵差異導致了專業選擇的差異。從2017年到2022年,各地區存在 “張雪峰效應”的專業佔所有專業的比例見下圖:
可以看到,從2017到2022年,平均有12%左右的專業有1%水平上顯著的“張雪峰效應”。 
也就是說,地區特徵確實影響了佔招生總數12%的專業的報考選擇,這樣的偏好差異在2019年達到了16%,隨後逐年下降,到2022年,只有7%的專業存在“張雪峰效應”了。
不同地區對於專業的偏好差異導致的報考選擇差異確實存在,但在前些年一直有縮小的趨勢,原本按照這個趨勢,再過幾年,地區間對專業的偏好差異可能傾向於消失。
但2023年,事情發生了變化。此時對不同地區專業報考產生影響的,不只是導致了不同“張雪峰密度”的地區特徵,還包括了確實在2023年時爆火的張雪峰言論。將2023年的情況加入,我們可以得到下圖——
可以看到,存在“張雪峰效應”的專業佔比,從2022年的7%,提升至2023年的28%。考慮到地區差異導致的專業選擇正在逐漸縮小,從2022到2023年約為21%的淨增,便只能歸因於張雪峰爆火這件事本身了。
如果將張雪峰效應的顯著性閾值從1%放寬到5%,則有下圖——
上圖有著同樣的效應。從2017到2022年,張雪峰效應僅在17%左右的專業中存在,2022年下降至14%,而2023年該比例上升至38.6%,比起2022年上升了24%
用這個結果回應我們在前文提到的一種可能性——因為原來就不喜歡/喜歡某專業,才會選擇成為張雪峰的粉絲,這種機制只能解釋2023年專業錄取排位變化差異的14%;因為成為了張雪峰粉絲,才變得不喜歡/喜歡某專業,這種機制可以解釋2023年專業錄取排位變化差異的24%
在排除地區特徵後,我們可以得出判斷——2023年,佔招生總人數五分之一到四分之一的專業錄取排位,被張雪峰改變了。在“張雪峰密度”較高的地區,每五個考生中,就有一個考生因為張雪峰改變了自己的專業選擇。
下圖列出了在2023年張雪峰效應最為明顯的專業——
可以看到,2023年時被張雪峰影響最大的專業,基本上都是文科以及財經類專業,其中新聞學金融學並不是被影響最大的——在張雪峰密度更高的地區,歷史學哲學專業的錄取百分位下降,達到了金融學和新聞學的兩倍以上。
從上圖中還能看到有趣的一點——存在張雪峰效應的專業,沒有一個影響係數是正的。避雷效應極為明顯,被張雪峰說不好的專業,考生避之不及。但是張雪峰推薦的專業,大家卻並沒有趨之若鶩。

“張雪峰效應”正確反映了就業形勢嗎?

一些觀點認為,張雪峰的爆火,代表不同階層人們的資訊差正在收窄。因為人們原本對這些專業僅有字面意義上的理解,是張雪峰將每一個專業的真實就業去向,要注意的事項,要避開的雷,都一一說清了,讓普通人也可以瞭解到每一個專業的真實就業趨勢。
那麼,因張雪峰的言論而產生的專業錄取百分位變化,和真實的就業變化,確實匹配嗎?那些被“避雷“的專業,在就業市場上,真的是“雷”嗎?
我們使用超過10億條招聘資料,對每一條招聘資料中類似“xx專業優先”的專業需求進行專業字典匹配,計算每一個專業在每一條招聘廣告中出現的比例。將各專業錄取人數在總錄取人數中的比例與在招聘廣告中的出現比例相比,便能得到直觀的供需關係,見下圖:
上圖給出了所有本科專業門類的招生佔比和招聘佔比。可以看到,兩者存在明顯的正相關,說明我們目前的專業供給和勞動力市場的需求還是基本匹配的。
但明顯供需不匹配的專業同樣存在。越靠近散點圖左上方,說明招聘佔比比招生佔比大得多,未來畢業生相對供不應求,反之則說明招聘佔比低於招生佔比,未來畢業生供過於求。偏離對角線的崗位越多,越遠,說明當前的專業招生設定和錄取情況和實際市場需求差別越大。
當然,這種演算法也存在一定侷限性,比如在圖片右下側我們可以看到幾乎所有醫學類專業,這是不是說明醫學類專業嚴重供過於求呢?不一定。因為正如我們前面提到的,這裡的“招聘佔比”使用的是公開招聘資料,主要來自各大招聘網站。而如果各大醫院招收醫生時均不透過招聘網站公開進行,那麼用招聘資料計算的“招聘佔比”就存在低估的可能。
因此,比起靜態的招聘佔比,“招聘佔比”隨時間的動態變化,可能是一個更為重要的參考趨勢。下圖列出了有計算機專業需求的招聘廣告佔比和計算機專業實際招生佔比的對比。
可以看到,計算機專業在就業市場的招聘廣告中的佔比正在一路下降。2017年,每9條招聘廣告中就有一條點名需要計算機相關專業的畢業生,但在2024年時,約14條廣告才有一條需要計算機專業的畢業生,佔比下降至8%不到。與此同時,2023年計算機類招生達到了所有招生的10.78%,已經高於招聘資料中計算機專業比例的需求比例。在這種情況下,計算機類相關專業雖然絕對需求仍然很大,但供給更大,在這些學生畢業後,未來可能會出現供過於求的現象。
那麼,張雪峰點名不推薦的新聞學和金融學的供需情況如何呢?
上圖列出了新聞傳播學類專業的招聘和招生佔比,包括了新聞學、傳播學、編輯出版學、網路與新媒體等專業。這個大類的專業,在招聘市場上的佔比從2017年到2022年確實存在下降趨勢,從3%左右下降到1%,但在近兩年重新回升至2.6%。2023年的新聞傳播學類專業的招生佔比為1.3%,目前呈現了供小於求的趨勢,且需求缺口正在擴大。
金融學類專業呈現了同樣的趨勢。金融學門類的二級專業包括投資學、保險學、精算學、網際網路科技等。這部分專業在招聘市場上的佔比從2017年的4%一路下降至2021年的1.7%,目前再度回升至2.5%。而2023年招生中,金融類專業的佔比為1.6%。因此,金融學類專業目前也呈現供給小於需求的趨勢,需求缺口也在擴大。
可能有讀者認為,這樣的結果與感知相差太遠,金融學類畢業生明明已經哀鴻遍野,何來“供不應求”?這裡需要強調一點——我們使用的是比例的對比,而不是總量對比。金融學類專業的招聘總量和需求總量,和之前幾年相比,可能確實下降了,但是其他的專業需求下降更快,導致金融學類的佔比反而上升了。
換句話說,大家都有困難,但某些專業可以發出非常大的聲量,“我超級困難”能讓全網聽見,即使他們的困難其實要比其他專業相對更小一點。
因此,張雪峰的一些判斷,更多反映的是2、3年前就業市場的趨勢。一些原本呈現頹勢專業,目前的就業情況已經逆轉;一些原本需求充足的崗位,則變得供過於求。從這個意義上說,根據2、3年前的趨勢進行選擇,資訊差並沒有縮小,而是被放大了——資訊確實是真實的,但卻滯後於週期,可能會使四年後的就業市場出現更大規模的不匹配。

寫在最後

從張雪峰的爆火,到大量專業的錄取情況變化,其實呈現了這麼幾個事實:
——資訊是稀缺的。
——人們迫切渴求得到真實的資訊。

——人們願意使用獲得的資訊來修正自己的選擇。

然而這正是一種悖論。
——當變化剛剛開始出現時,能夠發現的人總是少數。
——當某些變化發展到一定程度時,才能積累足夠的蛛絲馬跡,讓發現這些跡象的人們得出某些共性的結論,產生共鳴。
——當這樣的共鳴產生足夠能量的共振時,這種變化才能被人們大範圍地討論、傳播,並重新塑造人們的認知。張雪峰引發全網熱議的種種觀點,正處在這個階段
——當絕大部分人們的認知已經重塑完畢,新的共識產生時,舊的變化已經結束,新的變化正在開始。
因此,透過全網爆火的討論補全資訊差,那麼一定只能得到落後於變化的認知。真正的資訊差不會引發討論,因為它可能與絕大部分人的共識相左,更可能被無視。
人力有時而窮,意見領袖也不例外。與其盲從意見領袖的建議,時刻保持與資料和資訊的零距離,可能才是縮小資訊差的有效方法。
出於這個初衷,今年我們在小程式“資料團+”中繼續更新了高考志願分數線精準查詢的模組(目前呈現了2023年分數排名,在2024年高考出分後會逐省更新至最新分數排名),並加入了透過10億條招聘資料計算的各專業在各個城市的工資走勢、供給以及需求的比例,希望能夠切實減少專業選擇和就業前景之間的資訊差,對高考考生的志願選擇提供幫助。

相關文章