我接觸過HTTP://www.aliyun.com/zixun/aggregation/14294.html">的大資料有:
1.美國棱鏡計畫
2.前幾天新聞報導的,蘋果公司竊取使用者隱私
3.百度的使用者搜素習慣統計分析
4.淘寶的使用者購物習慣分析,智慧推薦寶貝
5.瀏覽器的智慧標籤頁
...
最想瞭解的大資料架構與演算法:
1.著名的Google 網頁排名演算法:PageRank
2.著名的聚類演算法:K-Means
7.CART
3.C4.5
4.k-Means
5.SVM
6.Apriori
...
大資料應用的未來挑戰和趨勢是:
最大的挑戰並不是技術和資料本身,而在與人們對於資料的認識和態度。 這方面很多互聯網公司做的比較好,它們擁有豐富的資料同時也有強烈的盈利需求,可以挖空心思的在各種資料上做文章;而對於很多傳統行業,尤其是政府,首先它們還是相當重視資料的,甚至比互聯網公司都要重視,但出於行政管理, 組織利益和安全等的考慮資料往往會形成孤島很難做到綜合利用。
另外一方面的挑戰是構建成功的大資料應用需要對業務邏輯和資料處理技術都有比較深入的理解,而且很難拆解開,因為業務的需求會直接影響到底層架構的設計以及演算法和工具的選擇,這一點和傳統的交易型系統有很大區別, 所以現在一些行業中的軟體+資料庫+硬體的分工模式不太適合大資料應用開發,市面上能夠對各種因素通盤考慮做整體架構的公司並不多。
趨勢的話我的理解,現在技術層面的工具,技術是一個百家齊放的局面,其原因一方面是開源專案的運營模式越來越成熟,另一方面是大資料的分析處理是多樣化的,相信未來很長一段時間都會維持這個局面, 傳統的軟體發展上已經逐漸向服務提供者轉變,產品本身可能變得越來越不重要,貼合用戶需求的定制化架構和解決方案可能更加受到歡迎,同時雲計算的不斷發展也將使得未來的架構設計更加輕鬆,部署和遷移更加便捷。
未來大資料的發展前景是巨大的,現在人們的生活已經離不開大資料了,雲計算、雲存儲、電商等等網站的資料都是大資料,但是大資料的發展的技術還是面臨挑戰,技術的發展新的技術也在不斷更新,所以大資料應用的挑戰是結合新技術, 不斷優化大資料的演算法。
大資料存儲技術、平行計算、輸送量
讀完試讀樣章後的啟發:
大資料其實才剛剛起步,正在打垮不發展,面臨著很大的機遇和挑戰,海量待挖掘資料,資料切分演算法,分散式圖計算了解到大資料的精深之處,要學習的還有很多,我感覺到了自己的不足之處,大資料加油,你一定會更好更牛逼,我看好你哦, 希望你能夠帶我飛的更高,go,go。。。