除了上帝,任何人都必須用資料來說話。”
我正在構思一篇討論軟體行業內,關於專業程度與薪酬間相關性的文章。而且我已經有了關於專業程度為什麼會影響薪酬,是如何影響薪酬,以及專業性產生偏好的猜測。接下來,我唯一需要做的是用資料統計論證。
首先,我拿到了2017年Stack Overflow的調查資料(https://insights.stackoverflow.com/survey/2017),對其進行清洗,然後插入了一些以前研究中認為能夠影響最終薪酬的變數。
資料分析中最棘手的問題之一是明白哪些變數需要測試,而哪些變數不測試,哪些是控制變數。例如,我可以測試“在工作中使用PHP”是否會增加薪水,但如果我沒有考慮到受訪者的國家,那麼我們可能無法證明PHP對薪水的影響程度。
我測試專業分支時,需要去簡化資料集並提高對專業分支變化的敏感度。於是,我選擇了只用來自美國的專業網頁開發人員的資料,然後對比專業的前端和後端開發人員與全棧開發人員的薪水,分析專業程度對薪酬的影響。
分析過程中,我逐步添加了以下變數:經驗,教育,網頁開發人員類型。然而,分析結果並不理想。我本以為,接受過正式的教育會對工資有正面影響,然而,意料之外的事情發生了。
我本身是一個網頁開發人員,負責全棧開發。我一直在想,如果我可以更專業一些,拿到電腦科學專業(ComputerScience,以下簡稱CS)學位而不是文科的學位,那麼我可能會賺更多的錢。而我弟弟擁有CS學位,而我和他的薪水是在兩個完全不同的量級上,我只能望其項背。所以我跟自己遇到的每一個對編程感興趣的人說:CS專業的本科學位是很值錢的,擁有它,你至少能跟別人產生2萬美金的永久性薪水差距,而且這還是我的保守估計。
所以你可以想象當我把CS專業與其他專業進行對比分析時,我有多震驚。因為結果居然是:不同專業的畢業生的工資之間並沒有顯著差異。
我想,“我的分析肯定哪裡做得不對”。在第一次分析時,我將CS專業畢業的工程師,數學家和資訊技術專業的畢業生都混在一起。顯然,CS專業需要被細分成不同的類別。
然後,我又進行了一輪分析。
但結果依舊是:不同專業間沒有顯著差異。
閱讀原文