標籤:
資料分析軟體
工欲善其事,必先利其器!
資料分析也好,統計分析也好,資料採礦也好、商業智慧也好都需要在學習的時候掌握各種分析手段和技能,特別是要掌握分析軟體工具!我曾經說過,沈老師的學習方法,一般是先學軟體開始,再去應用,再學會理論和原理,因為是老師,再去教給別人!沒有軟體的方法就不去學了,因為學了也不能做,除非你自己會編程式。
那麼在資料分析領域,都有哪些軟體分析工具呢?如何選擇呢?其實很多領域或者說分析方法都有相應的軟體工具,只要你想找就應該能夠找到!
這裡我把軟體分成縱橫四個層次的的象限圖來表達!
第一維度:資料存放區層——>資料報表層——>資料分析層——>資料展現層
第二維度:使用者級——>部門級——>企業級——>BI級
首先,儲存層:
我們必須能夠儲存資料,對個人來講至少應該掌握一種資料庫技術,當然也不一定要熟練操作,但至少要能夠理解資料的儲存和資料的基本結構和資料類型,比如資料的安全性、唯一性、冗餘性,表的關係,粒度,容量等,最好能夠理解SQL查詢語言的基本結構和讀取等等!
- Access2003、Access07等:這是最基本的個人資料庫,經常用於個人或部分基本的資料存放區;
- MySQL資料庫,這個對於部門級或者互連網的資料庫應用是必要的,這個時候關鍵掌握資料庫的庫結構和SQL語言的資料查詢能力;
- SQL Server 2005或更高版本,對中小企業,一些大型企業也可以採用SQL Server資料庫,其實這個時候本身除了資料存放區,也包括了資料報表和資料分析了,甚至資料採礦工具都在其中了;
- DB2,Oracle資料庫都是大型資料庫了,主要是企業級,特別是大型企業或者對資料海量儲存需求的就是必須的了,一般大型資料庫公司都提供非常好的資料整合應用平台;
- BI級,實際上這個不是資料庫,而是建立在前面資料庫基礎上的,這個主要是資料庫的公司專屬應用程式級了,一般這個時候的資料庫都叫資料倉儲了,Data Warehouse,建立在DW級上的資料存放區基本上都是商業智慧平台,或許整合了各種資料分析,報表、分析和展現!
第二:報表層
當企業儲存區了資料後,首先要解決的報表,還不是分析問題,是要能夠看到,看到報表,各種各樣的報表!國內外有專門提供報表分析服務的企業和軟體。
- Crystal Report水晶報表,Bill報表,這都是全球最流行的報表工具,非常規範的報表設計思想,早期商業智慧其實大部分人的理解就是報表系統,不藉助IT技術人員就可以擷取企業各種資訊——報表。而且很多資料庫內建的報表也是採用CR報表的開發版嵌入的!
- Tableau軟體,這個軟體是近年來非常棒的一個軟體,當然它已經不是單純的資料報表軟體了,而是更為可視化的資料分析軟體,因為我經常用它來從資料庫中進行報表和可視化分析,先暫列在報表層;
這個軟體從3.0開始,現在已經有了5.1版本,兩年的時間已經到了伺服器和Web方式了!
當然,如果企業有上萬張報表,需要好好管理起來,還有安全性,並發請求等,就需要有Server版;
博易智訊公司專門提供Crystal Report和Crystal Report Server版銷售和軟體服務;
第三:資料分析層
這個層其實有很多分析工具,當然我們最常用的就是Excel,我經常用的就是統計分析和資料採礦工具;
- Excel軟體,首先版本越高越好用這是肯定的;當然對Excel來講很多人只是掌握了5%Excel功能,Excel功能非常強大,甚至可以完成所有的統計分析工作!但是我也常說,有能力把Excel玩成統計工具不如專門學會統計軟體;
- SPSS軟體:目前的版本是18,名字也改成了PASW Statistics;我從3.0開始Dos環境下編程分析,到現在版本的變遷也可以看出SPSS社會科學統計軟體包的變化,從重視醫學、化學等開始越來越重視商務分析,現在已經成為了預測性分析軟體。
- Clementine軟體:目前的版本13.0,資料採礦工具,我從6.0開始用,到了13版,已經越來越多的提高了更多有好的建模工具,現在改名叫PASW Modeler 13建模器了。而且與SPSS統計功能有了更多的整合,資料處理也更加靈活和好用。
- SAS軟體:SAS相對SPSS其實功能更強大,SAS是平台化的,EM挖掘模組平台整合,相對來講,SAS比較難學些,但如果掌握了SAS會更有價值,比如離散選擇模型,抽樣問題,正交實驗設計等還是SAS比較好用,另外,SAS的學習材料比較多,也公開,會有收穫的!
當然,我主要是採用SPSS和Clementine,有時候就是習慣,當然會了一種軟體在學其他的也不是很困難!
- JMP分析:SAS的一個分析分支
- XLstat:Excel的外掛程式,可以完成大部分SPSS統計分析功能
- Ucinet社會網分析軟體:SNA社會網路分析是非常流行和有價值的分析工具和方法,特別是從關係角度進行分析社會網路,關係分析非常重要,過去我們都是屬性資料分析
大家如果有需要試用版,可以聯絡博易智訊,他們可以提供SPSS和Clementine軟體版本的諮詢。
第四:表現層
最近我一直在研究資料視覺效果技術,一方面是因為Excel大家有需求,另一方面就是我第一個購買了Xcelsius,也寫了《Excel進階應用程式與資料分析》和《資料展現的藝術——Xcelsius》。這個領域的軟體,特別是一些小工具非常有價值!
- PowerPoint軟體:這個沒得說了,大部分人都是用PPT寫報告;
- Visio、SmartDraw軟體:這些都是非常好用的流程圖、營銷圖表、地圖等,而且從這裡可以得到很多零件;
- Swiff Chart軟體:製作圖表的軟體,產生的是Flash;
- Color Wheel軟體:配色軟體
- Yed軟體:網路關係圖、流程圖和圖形分析軟體,類似SNA分析,我經常用來設計流程圖,還有就是分析最佳化關係圖;
- Netdraw軟體:這是社會網路分析展現軟體,主要是可視化網路關係圖的,讀取Ucinet軟體;
- Mindmanager軟體:思維導圖,非常好的軟體,可以把非線性思維很快構建起來,並且項目組織管理、報告設計構想都可以應用,直接產生PPT等,當然這個軟體功能非常強大,我的學生都用它來做筆記和會議記錄;
- Xcelsius軟體:Dashboard製作和資料視覺效果報表工具,可以直接讀取資料庫,在Excel裡建模,互連網展現,最大特色還是可以在PPT中實現動態報表;這個是我最希望應用的一個軟體工具,非常有價值!
最後,需要說明的是,我這樣的分層分類並不是區分軟體,只是想說明軟體的應用,其實每個層次的軟體都是相互融合的,追求:平台化,整合化,智能化,可視化,專業化,都是各有特色;價格也不同,有免費的,有上百萬的;有單機版的,有伺服器版的;有正版的,有盜版的!
有時候我們把資料庫就用來進行報表分析,有時候報表就是分析,有時候分析就是展現;當然有時候展現就是分析,分析也是報表,報表就是資料存放區了!
沒有最好,只有更好,適合你的就是最好的!
其實還有很多資料分析軟體:
- AMOS軟體:結構方程式模型SEM,實證研究和理論模型的重要分析工具,從事學術研究的人,特別是社會科學工作者應該掌握;
- Lisrel軟體:結構方程式模型SEM,同上!
- HLM軟體:分層線性模型;
原文地址:http://shenhaolaoshi.blog.sohu.com/148204624.html
資料分析軟體