51資料庫術語你需要知道
很多人都在談論資料的指數增長,我們很快就會得到比我們知道要做的更多的資料。然而,沒有那麼多人在談論資料庫這方面-但他們應該!隨著資料的增長,資料庫需要能夠跟上。這就是為什麼不僅要了解如何分析不斷增長的資料量,還要了解如何擁有能夠處理資料的資料庫,這一點變得越來越重要。這就是為什麼Dzone編輯團隊聚集了一個由51個數據庫術語組成的列表,您需要知道是否要在這種資料溢位的情況下保持執行。(順便說一句,如果你對此感興趣,你也可能對我們的大資料詞彙表!)
A
酸(原子性、稠度、隔離性、耐久性)一個術語,指資料庫事務的模型屬性,傳統上用於SQL資料庫。
骨料一組域物件,可以作為一個單元來處理。在大型分散式系統上儲存資料的理想單元。
阿帕奇卡桑德拉:一個開放原始碼的分散式資料庫系統,它可以跨伺服器儲存和管理大資料,也可以成為大型資料庫的讀取量大的資料庫。商務智慧系統。
阿帕奇·盧塞尼一個開源文字檢索庫,通常用於全文搜尋、實現搜尋引擎和實現推薦系統.
阿帕奇火花一個開放原始碼的並行處理框架,用於處理大規模的資料分析應用程式、實時分析和資料處理工作負載.
B
基礎(基本可用性、軟狀態、最終一致性)一個術語,指資料庫事務的模型屬性,特別是用於需要管理非結構化資料的NoSQL資料庫。
B樹:一種資料結構,其中所有終端節點與基的距離相同,所有非終端節點在n到2n個子樹或指標之間。它是針對讀取和寫入大量資料塊或執行大部分讀取的系統而優化的。
C
雲原生資料庫一個建立在雲端計算交付模型之上並執行的資料庫。
複雜事件處理*為分析和規劃目的從多個流收集資料的組織過程。
一致性資料庫事務的四個主要屬性之一,意味著如果事務失敗,資料將返回到其原始狀態,或者如果沒有失敗,則建立新的資料狀態。
D
資料庫聚類將兩個或多個伺服器和例項連線到資料庫,通常是為了容錯、負載平衡和並行處理。
資料譜系有關資料來源、更改方式和移動位置的資訊;可用於解決資料庫中的驗證和除錯問題。
資料管理組織如何處理儲存、處理和分析資料集的完整生命週期。
資料探勘在大量資料中發現模式並將這些資訊轉換為可以理解的格式的過程。
資料庫管理系統一套管理終端使用者和資料庫之間資料的軟體和工具。
資料倉庫:一組單獨的計算機,它們一起工作,似乎是一個單一的系統。這需要訪問中央資料庫、每臺計算機上的多個數據庫副本或每臺計算機上的資料庫分割槽。
分散式關係資料庫*包含物件(如表)的資料庫,這些物件是不同但相互關聯的系統的一部分。
分散式系統:一組單獨的計算機,它們一起工作,看起來像一個單一的系統。這需要訪問中央資料庫、每臺計算機上的多個數據庫副本或每臺計算機上的資料庫分割槽。
文件儲存一種資料庫,它從檔案而不是定義的表格中聚合資料,並用於以可搜尋的形式顯示檔案資料。
迪納摩資料庫:一個來自AWS的NoSQL資料庫服務,它具有較低的延遲時間,可以輕鬆地儲存和檢索大資料,並提供大量的通訊量。
E
彈性搜尋一個基於Java的搜尋引擎構建在ApacheLucene下,它搜尋和索引幾乎實時的檔案,並自動對JSON文件進行索引。
最終一致性*符合基本模型的資料庫將包含隨著時間推移變得一致的資料的想法。
F
容錯*系統對硬體或軟體故障作出反應的能力,而不影響其他系統。
G
相簿一種資料庫型別,用於處理具有大量關係的實體,如社交圖、標記系統或任何連結豐富的域;它還經常用於路由和定位服務。
H
HadoopApacheSoftwareFoundation框架是專門為高可伸縮性、資料密集型和分散式計算而開發的.它主要用於批量處理大型資料集,非常有效。
高可用性(HA)*指即使在元件發生故障後,計算機系統中仍可持續獲得資源。這可以通過冗餘硬體、軟體解決方案和其他特定策略來實現。
混合事務/分析處理:一種被稱為“打破事務處理和分析之間的牆”的應用程式體系結構,它支援實時決策。
I
記憶體中作為一個通用的行業術語,它描述了將資料載入到RAM或快閃記憶體中而不是硬碟或固態驅動器的資料管理工具。
J
加入:SQL中的一個子句,它使用每個表共有的值組合關係資料庫中一個或多個表中的列。
日誌記錄:指資料庫中所有資料更新的同時、實時日誌記錄。生成的日誌作為審計跟蹤,可用於在原始資料損壞或刪除時重建資料庫。
JPA(Java永續性API):Java規範,用於訪問、管理和持久化Java物件/類和關係資料庫之間的資料。
K
鍵值儲存一種以簡單的鍵值對儲存資料的資料庫型別。它們用於處理大量小的、連續的和潛在的易失性讀寫。
L
雷電儲存器-對映資料庫(Lmdb)一個B樹資料庫,它完全是事務性的,符合ACID的,體積小,並且使用MVCC.
日誌結構合併(LSM)樹一種資料結構,它使用通常組織成層次的不可變段或執行來寫入和編輯資料。有幾種策略,但第一層通常包含最新和活躍的資料。
M
地圖推理一種由Google建立的程式設計模型,用於在多個叢集上進行高可伸縮性和分發,以便進行資料處理。
多版本併發控制(Mvcc)一種處理機器同時讀寫資料庫的情況的方法。
N
非第一正規化查詢語言(N1QL)它由Couchbase開發,為面向文件的分散式資料庫提供了通用的查詢語言和基於JSON的資料模型.
NewSQL*關係資料庫系統的速記描述符,它提供與NoSQL系統相同的水平可伸縮性和效能。
NoSQL一種資料庫系統,它集成了在傳統SQL之外進行查詢的其他方法,並且不使用標準的關係結構。
O
物件-關係對映器(ORM)提供資料庫抽象層的工具,用於使用面向物件的程式語言而不是資料庫的查詢語言在不相容的型別系統之間轉換資料。
P
平行性作業系統能夠有效合作解決問題的狀態。
持久力:指的是一個程式的資訊,它的壽命超過了建立它的程序,這意味著它不會在關閉或清除RAM的過程中被擦除。資料庫提供永續性。
多標記永續性*指一個組織對不同型別的資料使用幾種不同的資料儲存技術。
R
關係資料庫在表、記錄和列中構造相互關聯的資料集的資料庫。
複製*用於資料共享的術語,以確保冗餘資源之間的一致性。
S
可伸縮性*資料庫或其他系統能夠承擔更多的資源和能力,並將多個實體連線起來,以提高效率,
圖式*單個數據庫獨特資料結構的術語。
切分也稱為“水平分割槽”,切分是指將資料庫分割成幾個部分,通常是為了提高應用程式的速度和可靠性。
強一致性一個數據庫概念,指無法提交違反資料庫資料有效性規則的事務。
結構化查詢語言(SQL)一種用於管理和操作資料的程式語言;主要用於關係資料庫。
W
寬欄商店*這些資料庫也被稱為“BigTable儲存”,因為它們與Google早期的BigTable資料庫有關,它們將資料儲存在可以容納大量動態列的記錄中。列名和記錄鍵沒有固定。