【轉】資料分析/資料採礦 入門級選手建議

來源:互聯網
上載者:User

標籤:線性代數   其他   壓力   畢業論文   有趣   網易   調試   美團   atl   

1.資料分析和資料採礦聯絡和區別

聯絡:都是搞資料的區別:資料分析偏統計,可視化,出報表和報告,需要較強的表達能力。資料採礦偏演算法,重模型,需要很深的代碼功底,要碼代碼,很多= =。 2.怎麼入門請百度“如何成為一名資料分析師”或者“如何成為一名資料採礦工程師”。英文好上Quora,不行上知乎,看看入門資料。 3.選哪些書看入門資料給你提供的書,有電子版下電子版,沒電子版買紙質書,花不了多少錢。 4.用什麼語言資料分析:excel是必須,R是基本,python是進階。SAS和Matlab給土豪去玩吧。資料採礦:python是必須,java/c/c++是基礎,hadoop/mapreduce/spark先掌握一點,因為並不是所有公司都有這麼大的資料量。 5.需要學數學嗎都需要資料分析:統計學,機率論,資料採礦:高數/數學分析,數值分析,線性代數,凸最佳化,運籌學(這些是基本)數字訊號處理,模式識別,矩陣論(進階) 6.要不要讀研究生一般來說,只有應屆生去找工作會比較看重學曆,因為你沒有其他可以展示你能力的。但是隨著工作時間久了(兩年+),你的能力遠超於你所在的學校,學曆就不重要了。如果要讀,建議讀計算數學/機率論/模式識別/電腦 方面的研究生,爭取發論文(高品質),否則應聘的時候並沒有什麼影響,當然,有些公司可能會在初篩的時候根據學曆篩選人,正常,真想進就多工作幾年再社招進去唄,學曆不好也不能怪別人對不對。工作幾年後,如果覺得到瓶頸了,可以再去讀書,沒什麼,這個時候可能你更清楚自己需要的是什麼。             7.選擇去哪個公司大公司核心職位優先>>中型公司核心職位>大公司邊緣職位>優秀的創業小公司核心職位>中型公司邊緣職位>坑人的創業小公司邊緣職位原因:1.大公司資料量多,人才多。能接觸到核心項目核心職位是最佳選擇。(BAT,網易有道,微軟等)2.中型公司發展快,機會多,壓力大,成長快。(美團滴滴58)3.創業公司慎選,如果有創業公司的offer,一看他們差不差錢,而看他們項目贏不贏利,三看團隊技術氛圍濃不濃。不差錢+盈利但技術氛圍不濃,可以去,但不適合對技術追求高的人;不差錢+技術氛圍濃但暫時不盈利,可以考慮,但要搞清楚盈利模式。盈利+技術氛圍濃但現在差錢,可以考慮,爭取成為核心成員,一旦融資不得了。如果差錢又不盈利技術氛圍還差,算了吧,耗不起。實在不知道怎麼選,就看兩點:1.資料量大小 2.技術氛圍。錢少可以以後賺,技術氛圍濃最重要。 8.怎麼面試1.誠實 2.真誠 3.展現你的潛力 9.沒有項目經驗怎麼辦應屆生要啥項目經驗,本科生就說說自己的畢業論文,數模/ACM/阿里的參賽經曆或獲獎經曆,以及可能會有的實習經曆。研究生就說實驗室的項目,負責的工作,完成的成果和發表的論文。不要誇大,如實說。 10.要不要培訓因人而異,但不建議。如果連搜尋能力和自學能力都沒有,就算你入了行,也會過得很痛苦的。更何況高昂的學費和造假的簡曆了。 11.到底該選資料分析還是資料採礦代碼能力強直接搞演算法,弱就先做資料分析,慢慢來,不著急。想我畢業的時候只會Matlab,後來被領導逼著兩星期學了R,一個月學了python,自己在業餘學了java,hadoop和spark等,也是一步步來的,不要想一口吃成個大胖子。 12.前途怎麼樣我從實習到現在年薪翻了5倍,你說怎樣。你要是只衝著錢去呢,去做銷售吧;要是喜歡純數呢,去做研究吧;要是喜歡從資料裡發現一些有趣的事情並應用上去,那就來做資料分析/資料採礦吧。 13.一天的工作大概是怎樣的到公司,跑資料,看結果,調優,跑資料,看結果,看論文,改代碼,調優,跑資料,看結果。。。 14.有沒有推薦的網站google(之前被牆了,某個晚上恢複了,馬上要迴歸了,現在不能用的話買個vpn吧,mac本推薦shadowsocks軟體)stack overflow:改bug神器github:開源大法好!Quaro:資料搜集地/經驗借鑒處(以及各類招聘網站:我不想學習的時候就看這個,看和自己理想的工作還有多少差距,打雞血。。) 15.有沒有推薦的IDEsublime text+secureCRE/iterm夠用了(mac本,windows的話就下個notepad++和linux就可以了)各種語言的IDE都可以下一個,調試用。沒有推薦,哪個順手用哪個。 16.用什麼電腦有錢直接上伺服器,沒錢買個配置高的,實在沒錢買個能敲的就行。以後工作有錢了再整個好的。 17.怎麼投簡曆校招有網申,我沒有搞過校招,不太清楚流程。如果錯過校招,最好去拉勾周伯通等垂直網站投。不太推薦58/趕集/智聯,這些招聘網站上的職位類型主流偏低端,碰到不靠譜的公司機率較大。 18.怎麼看崗位要求知道我的工作內容一個簡單的方法:所有資料分析類的崗位要求裡寫的要求會excel,PPT等的乾的都是統計員的活!所有資料分析類的崗位要求裡寫的要求會GA,pu,uv分析的都是運營部門的!所有資料採礦崗位裡寫的要求只有hadoop,spark,ETL的乾的都是資料倉儲的活!其他的自己看吧,資料採礦有好幾種職位:廣告ctr預估的,機器學習的,推薦系統,自然語言處理等等。自己選擇吧。反正入門都可以嘗試做做。 總之,入門容易深入難,數學不好可以學,但會制約你的發展,代碼不好也可以,但也會制約你的職業生涯,所以那些說“我覺得我數學不好代碼能力也不強覺得R好難英語也不好看不懂國外的網站學多了會不會迴轉發會不會找不到男/女朋友blahblah”的,你開心就好,你的職業生涯掌握在自己手中。 最後,感謝當初把我帶入門的彭愛民老師,高芹老師和李海雄老師等等,好想回去看你們啊!!!!!!! 以上是工作半年以來想到的所有新入行的人可能會問的問題,以及我自己踩過的坑的一些總結,不全面,也沒什麼調理,大家將就看吧。除了以上問題有什麼的再問我吧,上班時間不要問哦~(雖然下班也沒什麼時間,逗玩貓看看書刷刷手機就睡覺了  =  =)。 不要覺得我厲害,我覺得我到現在都是入門級,周圍同事搞深度學習碼代碼碼的飛起快被虐慘了,

【轉】資料分析/資料採礦 入門級選手建議

相關文章

聯繫我們

該頁面正文內容均來源於網絡整理,並不代表阿里雲官方的觀點,該頁面所提到的產品和服務也與阿里云無關,如果該頁面內容對您造成了困擾,歡迎寫郵件給我們,收到郵件我們將在5個工作日內處理。

如果您發現本社區中有涉嫌抄襲的內容,歡迎發送郵件至: info-contact@alibabacloud.com 進行舉報並提供相關證據,工作人員會在 5 個工作天內聯絡您,一經查實,本站將立刻刪除涉嫌侵權內容。

A Free Trial That Lets You Build Big!

Start building with 50+ products and up to 12 months usage for Elastic Compute Service

  • Sales Support

    1 on 1 presale consultation

  • After-Sales Support

    24/7 Technical Support 6 Free Tickets per Quarter Faster Response

  • Alibaba Cloud offers highly flexible support services tailored to meet your exact needs.