標籤:資料 工作 時間 程式 ui 對象 遊戲 程式員 朋友
大學同學要給孩子起名字,利用工作條件做的統計,非常有意思。經同意後分享給大家。
算算時間不早了,該給我們家**起名字了,於是今天中午利用大資料的優勢,做了個無聊的統計。
我抽取了2010年1月1日以後出生的30萬小朋友的姓名。
首先,竟然發現男女比例為18:13,可想而知未來男寶寶找對象該有多麼困難。其中,姓名為兩個字的小盆友有2.5萬人,三個字的小盆友有28.1萬人,四個字的小盆友有2000多人。四個字的小盆友大部分都是父姓+母姓+兩個字的名字。應該說,三個字的小盆友佔了絕大多數,竟達到了91%。
四個字的小盆友就算了,我對兩個字和三個字的小盆友按照男女性別不同又做了一次劃分,統計結果顯示:
1、兩字名的男寶寶第二個字出現頻率最高的前五名分別為“睿”(2.59%)、“浩”(2.56%)、“博”(1.82%)、“瑞”(1.80%)、“昊”(1.78%),也就是說,男寶寶叫hao或者叫rui的佔了很大比例。
2、兩字名的女寶寶第二個字出現頻率最高的前五名分別是“悅”(2.94%)、“妍”(2.45%)、“涵”(2.07%)、“玥”(1.53%)、“蕊”(1.42%),也就是說,女寶寶叫yue的佔有相當大的比例。
3、三字名的男寶寶第二個字出現頻率最高的前五名分別是“子”(5.93%)、“梓”(3.41%)、“浩”(3.32%)、“宇”(3.07%)、“俊”(2.50%),這一算不得了,竟然有接近十分之一的三字名男寶寶叫什麼zi什麼。
4、三字名的男寶寶第三個字出現頻率最高的前五名分別是“軒”(6.04%)、“宇”(5.16%)、“澤”(2.84%)、“傑”(2.49%)、“豪”(2.19%),這一算也嚇了一跳,竟然超過十分之一的三字名男寶寶叫什麼什麼軒或者什麼什麼宇。
隨後,我又用顫抖的手統計了一下三字名女寶寶的名字,結果更是令我感到震驚:
5、三字名的女寶寶第二個字出現頻率最高的前五名分別是“雨”(5.11%)、“梓”(3.69%)、“欣”(3.61%)、“子”(3.58%)、“思”(3.52%),也就是說,三字名女寶寶的中間字是這五個字的比例竟然高達五分之一!
6、三字名的女寶寶第三個字出現頻率最高的前五名分別是“涵”(6.75%)、“萱”(3.63%)、“怡”(3.18%)、“彤”(2.66%)、 “琪”(2.65%),同樣的,這前五名也佔了三字名女寶寶的近五分之一人數!其中,叫“涵”的女寶寶比例竟然高達6.75%,真是令人震驚。
本來到這裡已經統計結束了,後來發現還有一種更加變態的統計,當我按下運行按鈕,出來結果之後,我徹底的驚呆了:
7、三字名男寶寶的名字前六名分別是“浩宇”(0.90%)、“子軒”(0.73%)、“浩然”(0.59%)、“雨澤”(0.55%)、“宇軒”(0.55%)、“子涵”(0.51%)。
8、三字名女寶寶的名字前六名分別是“欣怡”(0.79%)、“子涵”(0.69%)、“梓涵”(0.59%)、“雨涵”(0.51%)、“可馨”(0.46%)、“詩涵”(0.45%)。
這樣算下來,我真的是嚇了一大跳,叫“子涵”或“梓涵”的小盆友,竟然比例如此之高!那麼,你們家小孩的名字是不是在以上行列呢?
而且,福士化的名字很明顯地帶有時代的氣息,與我們這一代的福士化名字多是“峰”、“鵬”、“豔”等等,這在10後小盆友名字中排在了30名以後的位置。而10後小盆友的福士名“軒”、“涵”、“浩”等等則更像是古裝電視劇或遊戲中的人物名字。難道10後的小盆友真的是父母練級打怪掉出來的嗎?
這次統計引起了我的深思,連寶寶的姓名都會隨著時代的發展而變化,而事實上或許大多數父母並不曾想到要給孩子起一個福士化的名字,避開了當年福士化的“峰”、“鵬”、“豔”、“麗”,但恰恰是這樣的思路,卻造成了一個新的時代的福士化潮流。
注* 此文在天涯、水木均有轉載,原文出處、作者已經不可考,歡迎告知。
程式員取名:用大資料分析一下寶寶取名時最容易重複的名字