資料倉庫一些整理(列式資料庫)
1、OLTP。這是on-line transaction processing的簡寫。翻譯成聯機事務處理。就是線上交易的業務資料。這方面的資料庫是關係型資料庫。 2、OLAP。On-Line Analytical Processing 翻譯成聯機分析處理。通俗理解,就是做資料統計、分析的平臺。順應這個需求產生了資料倉庫的概念。 3、資料倉庫。只是一個概念,資料的倉庫。搭建資料倉庫的技術方案可以是關係型資料庫,也可以是列儲存。為了通俗理解,可以把資料倉庫和OLAP看作一個東西。 4、商業智慧BI。本質還是依賴於資料倉庫做支援的,沒有資料儲存,沒有大量資料,無法統計、無法分析。 怎麼來理解或區分資料庫和資料倉庫的關係
行式儲存 | 列式儲存 | |
優點 | Ø 資料被儲存在一起 Ø INSERT/UPDATE容易 | Ø 查詢時只有涉及到的列會被讀取 Ø 投影(projection)很高效 Ø 任何列都能作為索引 |
缺點 | Ø 選擇(Selection)時即使只涉及某幾列,所有資料也都會被讀取 | Ø 選擇完成時,被選擇的列要重新組裝 Ø INSERT/UPDATE比較麻煩 |
資料庫名稱 | 所屬公司 | 是否商業收費 | 優點 | 缺點 | 說明 | 列式儲存(非行儲存) |
Oracle Warehouse Builder(OWB) | oracle | 商業收費 | 未知 | 未知 | 未知 | 未知 |
Sybase IQ/SAPIQ | SAP | 商業收費 | SAP公司收購資料庫公司SYbase的產品。Sybase IQ擁有列式儲存、網格架構、專利的資料壓縮、先進的查詢優化器。電信和金融行業的客戶較多 | 是 | ||
Vertica | 惠普公司 | 商業收費 | 未知 | 未知 | ||
hbase | Apache的Hadoop專案的子專案 | 開源免費 | 很適合統計多維度資料。目前看資料,樂視的視訊雲涉及到視訊多維度統計從redis、mysql遷到hbase,響應需求更快。Facebook用在很多業務中。 | 1、搭建和維護HBase是很繁瑣的,引入很多學習成本,遇到問題還要排查。2、Php操作hbase,需要安裝一facebook的服務thrift,這個服務安裝沒成功。一箇中間服務,不夠簡單。 | hbase與google的表格儲存資料庫bigtable是同一種東西。列儲存。hbase是模仿bigtable產生的。 | 是 |
hive | 開源免費 | 1、查詢速度比較慢。2、基於MapReduce來處理資料。需要理解mapreduce,會寫這種。目前來看不好上手 | 否,只是一中架構。 | |||
palo | 百度 | 開源免費 | 用在百度統計以及百度其他應用。 | 列儲存 | ||
clickhouse | 俄羅斯的Yandex | 開源免費 | 查詢速度快,SQL語句操作。 | 1、文件齊全。有官網。支援php、.net等各類語言,官網直接提供了各類語言的庫。2、速度很快。經過Yandex公司自身的實踐考驗。俄羅斯的nginx也是久經考驗。 | 此公司類似於中國的 百度和百度統計業務。為應對自身內部需要而開發 | 列儲存 |
Infobright | MySql公司 | 開源免費,有商業版和社群版 | 1、社群版不支援更改資料。只能載入資料。2、社群版只能支援10多個併發查詢 3、世面上用的人少。 | 列儲存 | ||
Greenplum | Greenplum | 商業收費 | 基於關係資料庫PostgreSQL做儲存 | 列儲存 | ||
Druid | 免費 | 列儲存 |
相關推薦
資料倉庫一些整理(列式資料庫)
術語備註: 1、OLTP。這是on-line transaction processing的簡寫。翻譯成聯機事務處理。就是線上交易的業務資料。這方面的資料庫是關係型資料庫。 2、OLAP。On-Line Analytical Processing 翻譯成聯機分析處理。通俗理解,就是做資
資料儲存---記憶體列式資料庫KDB+(Q)文件
Kx systems公司的創始人之一Arthur Whitney在2003年研發了列式資料庫KDB和它的操作語言Q。 官網:www.kx.com 主要Feature: 記憶體內的資料庫:理解KDB的一種方式就是KDB是一個記憶體資料庫,但擁有磁碟可
行式資料庫與列式資料庫的對比
導語:隨著大資料的發展,現在出現的列式儲存和列式資料庫。它與傳統的行式資料庫有很大區別的。 正文: 行式資料庫是按照行儲存的,行式資料庫擅長隨機讀操作不適合用於大資料。像SQL server,Oracle,mysql等傳統的是屬於行式資料庫範疇。 列式資料庫從一開始就是面向大資料環境下資
行式資料庫和列式資料庫區別
行式資料庫: 1.資料是按行儲存的 2.沒有建立索引的查詢將消耗很大的io 3.建立索引和檢視需要花費一定的物理空間和時間資源 4.面對大量的查詢,複雜的查詢,資料庫必須被大量膨脹才能滿足效能需求 列式資料庫: 1.資料是按列儲存的,每一列單獨存放 2.資料既是索引 3.只訪問查詢涉及的列
行式資料庫與列式資料庫
開發用了很久的Vertica,知道它是“列式資料庫”但一直沒有去研究過列式資料庫的一些特性,現在來總結一下。 列式資料庫是以列相關儲存架構進行資料儲存的資料庫,主要適合於批量資料處理和即時查詢。相對應的是行式資料庫,資料以行相關的儲存體系架構進行空間分配,主要適合於小批量的
Hbase與Oracle比較(列式資料庫與行式資料庫)
1 主要區別 1.1、Hbase適合大量插入同時又有讀的情況 1.2、 Hbase的瓶頸是硬碟傳輸速度,Oracle的瓶頸是硬碟尋道時間。 Hbase本質上只有一種操作,就是插入,其更新操作是插入一個帶有新的時間戳的行,而刪除是插入一個帶有插入標記的行。其主要操作是收集
測試環境MySQL的MyISAM行式資料庫引擎和InfoBright的brightHouse列式資料庫引擎
本機系統: 普通桌上型電腦,2CPU,2G記憶體,硬碟5400轉,Linux Ubuntu 12.04 32位 InfoBright按最小預設配置my-ib.cnf [mysqld] 27 port = 5029 28 socket = /tmp/mysql-ib.sock
oracle資料庫把某行資料轉成一列資料
select running_time, running_user, algorithm_id, algorithm_list_id, name1, name2, ROWNUM, wm_concat(t
大資料導論(4)——OLTP與OLAP、資料庫與資料倉庫
公司內部的資料自下而上流動,同時完成資料到資訊、知識、洞察的轉化過程。 而企業內部資料,從日常OLTP流程中產生,實時儲存進不同的資料庫中。同時定期被提取、經格式轉化、清洗和載入(ETL),以統一的格式儲存進資料倉庫,以供決策者進行OLAP處理,並將處理結果視覺化。 OLTP & OLAP 企業
小菜niao解說-----資料倉庫和資料庫
我相信會在百度上搜索什麼是資料倉庫或者搜尋資料庫和資料倉庫的區別的時候,大家都是對資料庫有了一定了解了(本人反正是這樣的,哈哈!!),所以就不再介紹什麼是資料庫了, 我先給大家大家家講講什麼是資料倉庫: 資料倉庫,是為了企業所有級別的決策制定計劃過程,提供所有型別資料型別的戰略集合。它出
#18 資料倉庫(hive)和資料庫(mysql)有什麼區別?
資料倉庫(hive)和資料庫(mysql)的區別 資料庫(DB=Data Base) 資料倉庫(DW=Data Warehouse) (1)資料的型別 資料庫(mysql):線上交易資料 資料倉庫(hive):歷史資料 (2)
MYSQL用命令列建資料庫,建表,插入資料及常見錯誤
1.登入 首先 cmd進入命令列然後cd到自己安裝的MySQL server的bin目錄下,例如我的是 cd C:\Program Files\MySQL\MySQL Server 8.0\bin 然後用root使用者登陸 C:\Program Files\MySQL\MyS
資料庫 與 資料倉庫 區別
資料庫與資料倉庫的區別 瞭解資料庫與資料倉庫的區別之前,首先掌握三個概念。資料庫軟體、資料庫、資料倉庫。 資料庫軟體:是一種軟體,可以看得見,可以操作。用來實現資料庫邏輯功能。屬於物理層。 資料庫:是一種邏輯概念,用來存放資料的倉庫。通過資料庫軟體來實現。資料庫由很
springboot的@cachePut在使用資料庫更新資料時一些奇怪的問題
在使用@CachePut來更新快取的時候,控制檯報如下錯誤: java.lang.ClassCastException: java.base/java.lang.Integer cannot be cast to java.base/java.util.List a
資料倉庫和資料庫的區別
資料庫:是一種邏輯概念,通過資料庫軟體來實現存放資料。資料庫由很多表組成,表是二維的,一張表裡面有很多欄位。欄位一字排開,對資料就一行一行的寫入表中。資料庫的表,在於能夠用二維表現多維的關係。如:oracle、MySQL、SQL Server等。 資料倉庫:從邏
資料庫為什麼會分為“行式儲存”和“列式儲存”呢?
我們知道 當今的資料處理大致可分為兩大類 聯機事務處理 OLTP (on-line transaction processing) 以及聯機分析處理 OLAP (On-Line Analytical Processing) OLTP 是傳統關係型資料庫的主要應用 用來執行一些基本的、日常的事務處
資料庫 與 資料倉庫的本質區別
資料庫 與 資料倉庫 資料庫:傳統的關係型資料庫的主要應用,主要是基本的、日常的事務處理,例如銀行交易。 資料倉庫:資料倉庫系統的主要應用主要是OLAP(On-Line Analytical Processing),支援複雜的分析操作,側重決策支援,並且提供直觀易懂的查詢結果。 我嘗
[資料庫] SQL查詢語句錶行列轉換及一行資料轉換成兩列
本文主要講述了SQL查詢語句表之間的行列轉換,同時也包括如何將一行資料轉換成兩列資料的方法、子查詢的應用、decode函式的用法。希望文章對你有所幫助~ 1.建立資料庫表及插入資料2.子查詢統計不同性質的學生總數3.一行資料轉換成兩列資料 union all4.錶行列資料轉
大資料系列之資料倉庫Hive知識整理(四)Hive的嚴格模式,動態分割槽,排序,事務,調優
1.Hive的嚴格模式Hive提供了一個嚴格模式,可以防止使用者執行那些產生意想不到的不好的影響的查詢。想想看在那麼大的資料量的前提下,如果我們在分割槽上表上使用查詢所有,或是使用了笛卡爾積查詢資料等等不良情況,那得花費我們多少時間和資源成本,Hive在預設情況下會開啟一種模
HBase 是列式儲存資料庫嗎
在介紹 HBase 是不是列式儲存資料庫之前,我們先來了解一下什麼是行式資料庫和列式資料庫。 行式資料庫和列式資料庫 在維基百科裡面,對行式資料庫和列式資料庫的定義為:列式資料庫是以列相關儲存架構進行資料儲存的資料庫,主要適合於批量資料處理(OLAP)和即時查詢。相對應的是行式資料庫,資料以行相關的儲存體