一直以來,大資料的使用遠遠不及大資料收集能力,就起原因主要是目前企業的資料主要分散在不同的系統或組織,大資料戰略的殺手鐧就是能夠更深度的,更豐富的挖掘所有資料系統中的有價值的資訊,從而更準確的預測客戶行為,發現商業價值, 但是目前很難將這些資料移到一個單獨的資料存儲中,另外,安全和監管問題也得不到保障,Oracle Big Data SQL的推出解決了現在面臨的難題。
以下為譯文:
發現企業或組織對資料管理架構的需求,Oracle推出Big Data SQL軟體來整合包括Hadoop、NoSQL和Oracle資料庫等在內的各種各樣的資料來源。
一套完整的解決方案是使Oracle的大資料設備和Big Data SQL結合起來,Cloudera的 Hadoop 分散式和Oracle自己的 NoSQL 資料庫。 開始時Oracle Big Data SQL只支援Apache Hive和Hadoop File System,其他供應商需要移植SQL關係資料庫到Hadoop上運行。
Oracle提供大資料設備和Big Data SQL的一套完整解決方案
Oracle Big Data SQL產品意味著管理員在處理非關聯式資料庫或Hadoop中的資訊時,不用再學習其他查詢語言,Oracle的大資料分析主管Neil Mendelson說。
我們可以使用我們已經習慣使用的Oracle SQL語言——完整的SQL語言,我們現在可以直接存取這三個中的任何一個資料來源或其中任意組合,他解釋道。
類似的工具都可以在開源社區如Stinger中獲得,這使得你可以使用SQL命令來查詢Hadoop中資料,或使用旨在NoSQL系統上實現SQL命令的CQL語言(Cassandra查詢語言)。
創建這個大資料管理系統的目標是希望SQL查詢能夠運行在不同的資料來源上,並且使企業或組織能夠利用現有的技術維護企業級資料安全,以及管理敏感的資訊。 Oracle表示這項技術其獨特的架構和Smart Scan繼承于Oracle Exadata,同時能夠允許Oracle Big Data SQL查詢所有形式的結構化和非結構化資料,並且最小化資料移動。
這也促進了Oracle資料庫的安全功能,包括組織現有的安全性原則,擴展到Hadoop和NoSQL資料。
Oracle的Dan McClary說,產品的開發已經有一段時間了,而且它超越了現有的技術。 他同時表示Big Data SQL與HDFS DataNodes和YARN NodeManagers能夠co-resident,另外,從新的外部表的查詢被發送到這些服務能夠保證直接路徑讀取和資料當地語系化。
Cloudera創始人、董事長兼首席戰略官Mike Olson說:「在oracle的大資料設備上運行Cloudera的軟體集比DIY集群部署更具成本效益並且速度更快。 在Hadoop查詢資料時,我們已經看到客戶對SQL強烈的需求。 」