近日,由長風聯盟舉辦的北京市雲計算產業發展研討會在京召開,來自行業產學研的行業專家就雲計算發展、標準進行了研討。 以下來自各個專家對於雲計算的看法以及觀點。
據瞭解,雲計算的本質,就是追求成本更低,資源更節約或者資源利用率更高,速度更快。 那麼究竟什麼是雲計算?雲計算的要素又是什麼?邊界在哪裡?對於企業的應用來講,最終的價值是什麼?
中科院計算所副研究員查禮,認為關於雲計算和網格的關係,他們本質都是一樣的,都屬於分佈系統學科;但是也有差異,首先從系統構成的方式來說,有一個重要的差異,網路計算強調地域分佈,而我現在接觸到的雲計算,是單管理運營, 地域分佈跨管理域和單管理域實現難度不一樣,單管理域的系統實現起來簡單一些,處理的問題比較少,這是一個技術上的差異。 另外,就是模式的差異。 我很贊同吳老師的定義,無論什麼模式,都跟以前的應用模式發生了巨大的變化,這個巨大的變化主要來源是什麼?例如于後端的能力,得到了極大的提高。
我們大家常用的金山詞霸,以前四五百兆,金山跟谷歌合作後,後端有一個通過網路方式提取一些詞的資訊,能力反而提高了,究其原因,是後端能力、存儲、計算、資料處理能力得到了極大的提高,這個也算是模式上的差異。
還有,模式肯定包括商業模式,你有一個新的市場出現了,大家都朝這個方向努力,傳統的軟體行業勢必會被雲計算模式發生重大的影響,勢必會產生新的市場。
從學術角度來說,還是分佈系統的問題,經典的問題,調度、資源管理、一致性、安全等等的一系列問題,這些都屬於分佈系統的範疇,只是按照它的實現、可實現性、實用性簡單化了,所以學術和工業界會有一個好的結合,原來我們做N多年研究, 很少放到工業性上,都直接用;現在這裡有了非常微妙的結合關係.
查禮同時對,雲作業系統進行了分析,他指出,我們跟國內外互聯網公司的合作非常多,我們也發現互聯網企業裡面的一些問題。 這是2009年的時候,FB講的自己內部的業務流程和基本組成,從這個圖上可以發現,業務的核心是這樣一個資料處理的集群,周邊包括前端、包括使用者的資訊、以及後端都圍繞這個核心來運轉。
我們在國內,也跟國內的互聯網公司有合作,他們也幾乎照搬這樣的結構,但是我們發現一些問題。
第一,海量的資源管理,這個集群的規模非常大,上千甚至上萬台,這個資源管理的問題是什麼,就是用這樣的系統太大,系統一大,問題就暴露出來了,一旦交易量下降,也不知道出現什麼問題,所有的維護人都要上去找問題, 這是一個具有很大挑戰的技術管理。
第二個問題,通用大資料計算需求。 這是符合Facebook業主的模式,國內的互聯網公司跟他相近,但是每一個都不相同,我們能不能把通用的總結出來,形成這樣一個平臺或者作業系統,給那些需要管理大規模機器處理資料的公司使用呢?
現在看起來,互聯網的產業從業務為王、資料為王的轉變,如何從大規模資料終產生價值是一個很大的挑戰。
另外一個需求,是現在一個趨勢,這個資料我現在能存、能處理了,下面要做什麼事?為了解決實質性的問題,這裡有圖片為例。 這個圖是Facebook提出的新的架構,FacebookPUMA,上下兩個是之前和之後的對比,而實質性的需求,現在已經擺在了面前。
現在我們做的工作,也是圍繞著開源的組織在做,我們之前做了行列分列式集成結構,這個已經是很多開源平臺進行了集成,而且Facebook已經把這個東西用在生產當中,所有的資料已經轉換或者正在轉換,這樣就可以節省25%的資源, 其他的性能提高有23%左右。
在多屬性線上查詢方面,我們已經將其用在淘寶魔方裡面,他每年的收入幾千萬。 我們就是多屬性線上查詢,原來七天資料容量增加到三個月,處理能力增大了一個數量級,吞吐增加了七倍。
開源軟體有一個lingcloud,做了資源分區、資源分裝。
雲作業系統,我們面對是百萬量級資料中心的規模,怎麼把這個資料中心管理,是雲作業系統要解決的問題。 這個作為系統組成的設想,我們想肯定跨越的資料中心之間需要廣域的資料傳播和資料保障,當然這個跟業務有關系。 之上可以提供共用和基礎設施,並且能夠把計算、存儲和網路資源動態的聚集、按需供給,我們還要管廣域的事情。
互聯網量級資料獲取、存儲、處理、交換到服務的生命週期,是離線式和線上式資料計算負載,如搜尋引擎、資料分析、資料採礦,我們還建立雲計算系統評價體系。
另外一個重要的部分,雲計算系統的安全體系。
雲作業系統研究方向建議,Laas,靈活管理新型資料中心的海量計算、存儲及網路資源,paas覆蓋互聯網量級資料互用。
我們在had doop、開源做了很多工作,12月3日,我們聘請谷歌、Facebook一些學術界大腕過來分享一下,今天這個會的主題是海量資料掘寶。 我們網站也有這個消息。
清華大學武永衛:我現在做雲計算平臺的安全。 我以前不是做安全的,對加密不懂,我不知算做安全的人怎麼看這個事情,我從做系統的角度看這個問題,最讓我無地自容的一個問題是安全問題,開會的時候,一個女老師要來用我的雲存儲,她說你能看見我的資料嗎?我說確實能看見。 從這個問題開始,學校宣傳部找我們,說這個會扯出了麻煩事情,集中一點就是我們做系統的人,能夠看到使用者的資料。
其實在雲裡做安全的人很多,有很多方式和解決方案,最終落實一點都是加了密,放在硬碟裡面,不管使用者加密、還是系統加密,另外,我保證加密存儲,你自己可以把系統解密,如果這樣的資料,最後無非要處理,即便不處理,在上傳下載的時候, 要經過記憶體一道關。 如果我通過一些方式去查驗的話,你核心資料的結果,我百分之百能夠看到,如果我把裡面記憶體的資料拿出來,然後慢慢去推,這個完全可能,這個就是核心的問題。 我們如何確保運行的資料,特別是運用形態資料的一些私密性的保護,因此在這方面我想雲計算裡面的問題,第一個就是隱私性,這塊我們做了一點工作。 如果給立項、建議,我想這方面可以加重一下。