記憶體資料管理(第2版)

來源:互聯網
上載者:User

《記憶體資料管理(第2版)》
基本資料
原書名: In-Memory Data Management:Technology and Applications,Second Edition
原出版社: Springer; 2nd ed. 2012 edition
作者: (德)哈索 亞曆山大.蔡爾
譯者: SAP
出版社:清華大學出版社
ISBN:9787302292562
上架時間:2012-8-9
出版日期:2012 年8月
開本:16開
頁碼:291
版次:1-1
所屬分類: 電腦 > 資料庫 > 資料庫儲存與管理

 
 


更多關於 》》》《記憶體資料管理(第2版)》
內容簡介
書籍
電腦書籍
  試想您住在美國的一個大城市裡。現在,想象一下每次您需要一杯水時,您不是去廚房取,而是需要先開車到機場,接著坐上飛機飛到德國,然後在那拿起一杯水。從現代CPU 的角度來看,訪問記憶體資料就如同從廚房取一杯水。而訪問電腦硬碟中的資料就好比飛到德國去取一杯水。在過去,主存的成本高昂,於是必須飛到德國去取水。然而,過去幾年,主存每 MB 的成本顯著降低,最終使得從廚房取一杯水成為有成本效益且更加便利的選擇。
  這種訪問時間上的巨大差別對於企業級應用有重大影響。在過去由於花費時間過長而未曾考慮過的事情現在已經成為可能,這有助於企業將之前以臆測和猜測為主的工作轉變為切實的洞察力。
  本書中所述的記憶體計算革命不僅僅是指將資料存放區於記憶體中,以便更快地進行訪問。我們還闡述了 IT 行業其他兩大趨勢的融合:(a)多核CPU 的出現以及軟體並行化的必要性(b) DRAM 訪問延遲造成的阻塞,要求軟體巧妙地平衡CPU和記憶體活動;需要利用以上兩點以真正挖掘潛在效能優勢。我們介紹的記憶體資料管理願景的另一個重要方面是,底層資料庫中資料存放區方式的變化。正如下面的章節所述,這與我們所關注的企業級應用的關係尤為密切。記憶體資料管理的作用就在於將所有這些聯絡在一起。   
  記憶體資料管理與列儲存相結合   
  我們的經驗表明,許多企業級應用利用資料庫的方式相似。在執行期間,他們處理大量資料行,但最為關鍵的是,只有表中的一小部分資料列可能會對某項特定查詢有用。本書中所述的列儲存模型允許僅讀取所需列,而表中其餘部分則可以忽略。傳統的行優先模型則不同,必須訪問表中的所有列,即便是對結果來說不必要的列也在存取範圍之內。
  列儲存模型也意味著將給定列中的元素儲存在一起。而在行優先模型中,給定列中的資料與行中的其他資料存放區在一起,因而企業級應用常見的聚集操作在列儲存模型中的速度要比在行優先模型中快得多。   
  多核和多台電腦上並行化的實現  
  單個 CPU核心的速度不會再快些,而 CPU 核心的數量卻仍有望每 18 個月翻一番。因此利用多核 CPU 的平行處理能力對未來的軟體開發至關重要。正如之前所述,記憶體列儲存將給定列中的資料一起儲存在記憶體中,從而便於分配一個或多個核心來處理單列。這稱為垂直分區。
  同時,也可將表分成資料行集合,然後再分配至不同的處理器,這一過程稱為水平分區。水平分區在資料量持續增加時尤為重要,且在資料倉儲應用程式的並行化中取得了部分成功。不但在單個多核電腦上,而且在群集或資料中心中的多台電腦上均可應用這兩類方法。   
  利用壓縮技術提高效能並節省空間的   
  資料壓縮技術利用資料冗餘性和有關資料領域的知識。壓縮尤其適合於企業資料管理情境中的列儲存,因為同一列中的所有資料(a)具有相同的資料類型(b)在很多情況下,有很少數量的唯一值,比如在國家列或狀態列中。在列儲存中使用壓縮技術有兩個原因:節省空間的和提高效能。
  空間的有效利用對於記憶體資料管理尤為重要,這是因為,即使主存成本已大幅下降,然而與磁碟相比,它相對而言依然更加昂貴。由於在列中進行了壓縮,因此與空間消耗相關的資訊密度得到了提高。這樣一來,每次便可載入更多的相關資訊,從而提高了效能。與行儲存相比,它需要的載入操作更少。因為在行儲存中,對於查詢來說不相關的列也被載入,但卻沒有被利用。  
  結論
  記憶體資料管理不僅僅是一項技術,也是軟體開發的另一種思路。我們必須考慮基礎硬體因素,比如到主存或磁碟的訪問時間以及通過多核 CPU 可能實現的並行化。考慮到新硬體環境,我們必須編寫能直接的充分利用它的軟體。從積極的角度來看,對於企業級應用開發人員,本書為針對所有這些問題的資料庫層的開發奠定了技術基礎。然而從消極的角度來看,資料庫本身並不能解決所有問題。開發人員一定要瞭解底層的軟體和硬體知識,以便充分利用潛在的效能優勢。本書旨在協助建立這方面的理解。

目錄
第一部分企業級應用的轉折點
第 1 章 可取性、適用性、可行性——記憶體計算技術的影響
1.1 即時資訊——隨時隨地擷取任何資訊
1.1.1 思想速度般的響應
1.1.2 即時分析和動態計算
1.2 最新硬體趨勢的影響
1.2.1 企業級應用的資料庫管理系統
1.2.2 主存是新磁碟
1.2.3 從最大化 cpu 速度到多核處理器
1.2.4 增加的 cpu 和主存之間的頻寬
1.3 通過記憶體資料管理降低成本
1.3.1 總體擁有成本
1.3.2 企業系統中的成本因素
1.3.3 記憶體計算的效能促進成本降低
1.4 結論
第 2 章 企業級應用為何如此繁雜零亂
2.1 當前的企業級應用
2.2 企業級應用範例
2.3 企業級應用架構
2.4 企業級應用中的資料處理
2.5 企業級應用中的資料訪問模式
2.6 結論
第 3 章 sanssoucidb——企業記憶體資料庫系統的未來藍圖
3.1 重點關注多核和主存
3.2 記憶體資料庫系統設計
3.3 sanssoucidb中資料的組織與訪問
3.4 結論
第二部分 sanssoucidb:通過記憶體計算技術提供單一資料來源
第 4 章 sanssoucidb 的技術基礎
4.1 瞭解記憶體階層
4.1.1 主存簡介
4.1.2 主存階層的組織圖
4.1.3 記憶體階層的趨勢
4.1.4 從程式員的角度看待記憶體
4.2 使用多核和跨伺服器進行並行資料處理
4.2.1 通過添加資源增加容量
4.2.2 並行系統架構
4.2.3 企業級應用程式資料庫的並行化
4.2.4 sanssoucidb 中的並行資料處理
4.3 通過壓縮提高速度和減少記憶體消耗
4.3.1 輕量級壓縮
4.3.2 重量級壓縮
4.3.3 資料相關的最佳化
4.3.4 壓縮感知的查詢執行
4.35 真實資料的壓縮分析
44 列優先、行優先、混合方式——最佳化資料布局
4.4.1 垂直資料分割
4.4.2 尋找最佳布局
4.4.3 混合型資料庫面臨的挑戰
4.4.4 應用情景
4.5 虛擬化的影響
4.5.1 分析型工作負載的虛擬化
4.5.2 資料模型和基準測試環境
4.5.3 虛擬執行與本地執行
4.5.4 使用並行虛擬機器減少回應時間
4.6 技術概念匯總
4.7. 結論
第 5 章 sanssoucidb 中資料的組織與訪問
5.1 用於訪問記憶體資料的 sql
5.1.1 sql 的角色
5.1.2 查詢的生命週期
5.1.3 預存程序
5.1.4 資料群組織和索引
5.1.5 任何屬性均可作為索引
5.2 憑藉資料老化提高效能
5.2.1 主動和被動資料
5.2.2 老化過程在實現上的考慮
5.2.3 銷售線索水平資料分割的用例.
5.3 高效檢索業務對象
531 從資料庫中檢索業務資料
532 對象資料指南
5.4高效執行業務函數
5.4.1區分業務函數與應用程式函數
5.4.2比較業務函數
5.5 處理讀取最佳化資料庫中的資料更改
5.5.1 對 sanssoucidb 的影響
5.5.2 合并過程
5.5.3 通過單列合并提高效能
5.6 只添加、不刪除,保持記錄的完整性
5.6.1 “只插入”實施策略
5.6.2 通過“只插入”操作最小化鎖定
5.6.3 對企業級應用的影響
5.6.4 “只插入”方法的可行性
5.7支援交易資料分析
5.7.1 動態聚集
5.7.2 無星型模式的分析查詢
5.8不停機擴充資料布局
5.8.1 行儲存中的重組
5.8.2 列儲存中的動態附加
5.9利用進階日誌技術提高業務恢複能力
5.9.1 列儲存中的恢複
5.9.2 行優先資料庫的差分日誌記錄
5.9.3 提供高可用性
5.10對混合負載進行最佳化調度的重要性
5.10.1 調度簡介
5.10.2 混合負載的特徵
5.10.3 已耗用時間較短與較長任務的調度
5.11結論
第三部分 記憶體計算技術所帶來的改變
第 6 章 應用程式開發
6.1 最佳化 sanssoucidb 的應用程式開發
6.11 記憶體應用程式的編程模式
6.12 應用程式架構
6.13 將商務邏輯移到資料庫中
6.14最佳實務
6.15 視圖的圖形建立
6.2 創新的企業級應用
6.21 全新分析應用程式
6.22 運營處理協助簡化日常業務
6.23 創新使用者介面讓資訊觸手可及
6.24 合并分析與文本搜尋
6.25 基本搜尋類型
6.26 企業搜尋功能
6.3 結論
第 7. 章 即將呈現的真正的商務智能系統
7.1 運營資料分析
7.1.1 過去的商務智能
7.1.2 如今的商務智能
7.1.3 將分析從日常運營中分離出來的弊端
7.1.4 為分析系統設計的專用資料庫
7.1.5 分析和查詢語言
7.1.6 促進商務智能變化的驅動因素
7.1.7 未來的商務智能
7.2 改變.之後如何評估資料庫
7.2 企業計算基準測試
7.2.2 為混合負載量身定製的新基準測試要求
7.2.3 日常運營和分析的新基準測試
7.3 結論
第 8 章 在雲端運算中擴充 sanssoucidb
8.1 什麼是雲端運算
8.2 雲應用程式的類型
8.3 從供應商的角度看雲端運算
8.3.1 多租戶
8.3.2 低端硬體與高端硬體
8.3.3 複製
8.3.4 憑藉記憶體計算技術提高能源效率
8.4 結論
第 9 章 記憶體計算技術革命已拉開序幕
9.1 無風險過渡到記憶體資料管理
9.1.1 記憶體系統和傳統系統並肩工作
9.1.2 系統整合和可擴充性
9.2 客戶驗證點
9.2.1 柏林夏洛特醫科大學
9.2.2 hilti
9.3 結論
關於作者
參考文獻
術語表
索引

本圖書資訊來源:中國互動出版網

聯繫我們

該頁面正文內容均來源於網絡整理,並不代表阿里雲官方的觀點,該頁面所提到的產品和服務也與阿里云無關,如果該頁面內容對您造成了困擾,歡迎寫郵件給我們,收到郵件我們將在5個工作日內處理。

如果您發現本社區中有涉嫌抄襲的內容,歡迎發送郵件至: info-contact@alibabacloud.com 進行舉報並提供相關證據,工作人員會在 5 個工作天內聯絡您,一經查實,本站將立刻刪除涉嫌侵權內容。

A Free Trial That Lets You Build Big!

Start building with 50+ products and up to 12 months usage for Elastic Compute Service

  • Sales Support

    1 on 1 presale consultation

  • After-Sales Support

    24/7 Technical Support 6 Free Tickets per Quarter Faster Response

  • Alibaba Cloud offers highly flexible support services tailored to meet your exact needs.