大資料相關術語(2)

來源:互聯網
上載者:User

標籤:

27.LDB(local DataBase):本機資料庫
本機資料庫是指駐留於運行客戶應用程式的機器上的資料庫。本機資料庫提供最快的相應時間。因為在用戶端沒有網路傳輸。

本機資料庫位於本地磁碟或區域網路上。如果有幾個使用者同時訪問資料庫,本機資料庫採取攘於檔案的鎖定策略。因此本機資料庫叫基於檔案的資料庫。典型的有Paradox、dBasep、FoxPro、Access。

 

28.DAQ(data Acquisition):資料擷取
資料擷取是指將被測對象的各種參量通過各種感應器做適當轉換後,在經過訊號調理、採樣、量化、編碼、傳輸等步驟傳遞到控制器的過程。
各類資料擷取系統的資料擷取過程基本相同,一般包括這樣幾個步驟:
1.用感應器感受各種物理量,並把他們轉換為電訊號;
2.通過A/D轉換,類比量的資料轉變為數字量的資料;
3.資料的記錄,列印輸出或存入磁碟檔案;
各種資料擷取系統所用的資料擷取程式有:

大型專用程式、固話的採集程式(小型專用系統)、利用軟體工具使用者自行編製的採集程式(組合式系統)

 

29.data model:資料模型

資料模型是顯示世界資料特徵的抽象,用於描述一組資料的蓋面和定義。資料模型數受苦中資料的儲存方式,是資料庫系統的基礎。在資料庫中,資料的物理結構成為資料的儲存結構,就是資料元素在電腦儲存空間中的表示及其配置;資料的邏輯結構則是指資料元素之間的邏輯關係,它是資料在使用者或程式員面前的表現形式,資料的儲存結構不一定與邏輯結構一致。

 

30.範式(資料庫術語)
範式是符合某一種層級的關係模式的集合,關聯式資料庫中的關係必須滿足一定的要求,滿足不同程度要求的為不同範式。

目前範式有:第一範式、第二範式、第三範式、BC範式、第四範式、第五範式。

 

31:資料壓縮(data compression):
資料壓縮是以及可能少的數位來表示信源發出的訊號,較少容納給定的訊息集合或資料採樣集合的訊號空間。這裡的訊號空間,就是被壓縮的對象,是指某訊號集合所佔的時域、空域和頻域。訊號空間的這幾種形式是仙童冠梁的,儲存空間的減少,意味著訊號傳輸效率的提高,所佔頻寬的節省。只要採取某種方式來減少某個訊號空間,就能夠壓縮資料。

資料壓縮是資訊理論中的一個很重要的概念。從資訊理論的角度來講,信源編碼的一個最主要的目的就是要解決資料的壓縮問題。這一點,反映在整個通訊過程中。

 

32.資料恢複(data recovery)

資料恢複是指由於各種原因導致資料損失時,把保留在介質上的資料重新還原。及時資料被刪除或硬碟出現故障,在介質沒有嚴重受損的情況下,資料均有可能被無損恢複。格式化或誤刪除引起的資料損失情況,大部分資料未損壞。只要通過軟體重新恢複串連環節,即可重讀資料。如果硬碟因硬體損壞無法訪問,只要更換髮生故障的零件,即可恢複資料。但在介質嚴重受損或資料被覆蓋時,資料極難恢複。

 

33.Data Integration(data integtation)

Data Integration就是講若干個分散的資料來源中的資料、邏輯的或物理的整合到一個同意的資料集合中。Data Integration的核心任務是要講互聯的分布式異構資料來源整合到一起,使使用者能夠以透明的方式訪問這些資料來源。整合是指維護資料來源整體上的資料一致性、提高資訊共用利用的效率;透明的方式是指使用者無需關係如何?對異構資料來源資料的訪問,只關心以何種方式訪問何種資料。實現Data Integration的系統成為Data Integration系統。他為使用者提供統一的資料來源提供者,執行使用者對資料來源的訪問請求。

 

34.資料移轉(data migration)

資料移轉是資料系統整合中保證系統平滑升級和更新的關鍵區段。在資訊化建設過程中,隨著技術的發展,原有的資訊系統不斷被功能更強大的新系統所取代,從兩層結構到三層結構,從C/S到B/S 。在新舊系統的切換過程中,必然要面臨一個資料移轉的問題。

 

35.資料來源(data element)

資料元即資料元素,是通過定義、標識、表示和允許值等一系列屬性描述的資料單元,在一定語境下,構建一個語義正確、獨立且無I儀的特定概念語義的資訊單元。資料元可理解為資料的基本單元,將若干具有相關性的疏遠按一定次序組成一個整體結構即資料模型。

 

36.資料冗餘(data redundancy)

資料冗餘是指同一個資料在系統中多次重複出現。在檔案系統中,由於檔案之間沒有聯絡,有時一個資料在多檔案中出現;而資料庫系統則克服了檔案系統的這種缺陷,但仍然存在資料冗餘問題。消除資料冗餘的目的是為了避免更新時可能出現的問題,以便保持資料的一致性。

 

37.資料幫浦

資料幫浦是從資料來源總抽取資料的過程。資料幫浦是指從來源資料源系統抽取目的資料來源系統需要的資料。實際應用中個,多採用關聯式資料庫。

 

38.資料標準化(data standardization)

資料標準化是指研究、制定 和推廣應用統一的資料分類分級、記錄格式及轉換、編碼等技術標準的過程

 

39.資料備份(data backup)
資料備份是把檔案或資料庫從原來的儲存地方複製到其他地方的活動,其目的是為了在這杯發生故障或其他威脅資料安全的災害時保護資料,將資料遭受破壞的程度見到最小。取回原先備份檔案的過程叫做資料恢複
1.完全備份(Full backup)
這種備份策略優點是當發生資料丟失的災難時,可以徐蘇恢複丟失的資料。
不足:每天對整個系統進行完全備份,造成備份的資料大量重複。對於業務繁忙、備份時間有限的使用者,選擇這種策略不明智
2.增量備份(Incremental Backup)
先進行一次完全備份,接下來對當前新的或被修改過的資料進行備份,節省磁碟空間,縮短備份時間;缺點是當災難發生時,資料的恢複比較麻煩,備份的可靠性很差
3.差分備份(Differential Backup)

先進行系統完全備份,接下來將當天所有與備份不同的資料備份到磁碟上。避免了以上兩種側羅的缺陷,有具有其所有優點。首先,它無需每天對系統做完全備份,因此節省時間和磁碟空間。其次,災難恢複也很方便,一旦發生問題,使用者只需要使用完全備份和發生問題前一天的備份就可以將系統復原。

 

40.貪心演算法(Greedy algorithm)
貪心演算法是指在對問題求解時,總是做出在當前看來是最好的選擇。也就是說,不從整體最優上加以考慮,他所做出的僅僅是在某種意義上的局域最優解。

貪心演算法不是對所有的問題都能得到整體最優解,關鍵是貪心策略的選擇,選擇貪心策略必須具備無後效性,即某個狀態以前的過程不會影響以後的狀態,只與目前狀態有關。

 

41.分治法(Divide and Conquer)

在電腦科學中分治法是一種很重要的演算法,分而治之。就是把複雜的問題分成兩個或更多的相同或相似的子問題,再把子問題分成更小的子問題。知道最後子問題可以簡單的直接求解。原問題的解即子問題的解的合并。這個技巧是很多高效演算法的基礎(排序演算法、傅裡葉變換)

 

42.動態規劃(Dynamic programming)

動態規劃是運籌學的一個分支,是求解決策過程最佳化的數學方法。把多階段過程轉化為一系列單階段問題,利用各階段間的關係,逐個求解。

 

43.迭代法(Iterative Method)

迭代法也稱輾轉法,是一種不斷用變數的舊值遞推心智的過程。迭代分為精確迭代和金絲迭代。"二分法"和"牛頓迭代法"屬於近似迭代法。迭代演算法是電腦解決問題的基本方法。利用電腦運速塊,適合做重複操作特點,讓電腦對一組指定重複執行。在每次執行時,都從變數的原值推出它的新值

 

44.分支界限法(branch and bound method)
是用途十分廣泛的演算法,運用這種演算法的技巧性很強,不同類型的問題解法也不同。

基本思想:對有約束條件的最佳化問題的所有可行解空間進行搜尋。該演算法在具體執行時,把全部可行的解空間不斷分割為越來越小的子集(分支),並為每個子集內的解的值計算一個下界或上界(定界).在每次分支後,對凡是界限超出已知可行解值那些子集不再做進一步分支。這樣,解的許多子集就可以不予考慮了,從而縮小搜尋範圍。這一過程直到進行到找到可行解為止,該可行解的值不大於任何子集的界限。因此這種演算法一般可以求得最優解。

 

45.割圓術(cyclotomic method)
用圓內接正多邊形的面積去無限逼近圓面積並以此求取圓周率的方法

大資料相關術語(2)

相關文章

聯繫我們

該頁面正文內容均來源於網絡整理,並不代表阿里雲官方的觀點,該頁面所提到的產品和服務也與阿里云無關,如果該頁面內容對您造成了困擾,歡迎寫郵件給我們,收到郵件我們將在5個工作日內處理。

如果您發現本社區中有涉嫌抄襲的內容,歡迎發送郵件至: info-contact@alibabacloud.com 進行舉報並提供相關證據,工作人員會在 5 個工作天內聯絡您,一經查實,本站將立刻刪除涉嫌侵權內容。

A Free Trial That Lets You Build Big!

Start building with 50+ products and up to 12 months usage for Elastic Compute Service

  • Sales Support

    1 on 1 presale consultation

  • After-Sales Support

    24/7 Technical Support 6 Free Tickets per Quarter Faster Response

  • Alibaba Cloud offers highly flexible support services tailored to meet your exact needs.