列族數據庫的設計

阿新 • • 發佈：2018-05-30

全部大量數據 tro 實體數據表機器如果從數據 bsp

1. 與列族數據庫相關的設計要點

列族數據庫應該事先成稀疏且多維的 map
在列族數據庫中，各個數據行所擁有的列是可以有所不同的
列族數據庫的列是可以動態添加的
列族數據庫不需要執行連接操作，需要對數據模型去規範化處理

2. 設計數據表格時需遵循的建議

用去規範化來代替連接
善用無值的列
同時在列名和列值之中存儲數據
用一個數據行來為一個實體建模
設計行鍵時不要講大量操作分配給少數服務器
維護適當數量的列值版本
不要在列值中使用復雜的數據結構

3. 使用列族數據庫時怎樣才能避免執行連接操作？

在列族數據庫中，多對多的關系是通過去規範化的數據模型來表示的。

4. 為什麽說實體應該建模成一個單獨的數據行？

實體可以表示具體的事物，也可以表示成抽象的概念。列族數據庫用數據行來對實體進行建模。

一個數據行應該對應於一個實體。數據行之間通過 row key 來區分身份。

而且列族數據庫不需要執行連接操作，需要對數據模型去規範化處理。

列族數據庫並不提供與關系數據庫級別相同的事務控制機制。

一般來說，對數據行的寫入是原子操作。若更新表格中的多個列，則這些列全部得到更新，要麽一個也無法更新。

5. 什麽叫做熱點現象(hotspotting), 為什麽應該避免這種現象？

分布式系統可以使我們利用許多臺服務器來解決問題，但如果把大量的任務都壓在了少數幾臺服務器上，就會令

分布式系統中產生熱點(hotspotting)，這樣就會導致其他的服務器未能得到充分利用，也未能真正發揮分布式系統的優勢。

6. 把復雜的數據結構用作列值會有哪些缺點？

用不同的列來存放不同的屬性，使得大家能夠更加便利的在這些屬性上運用列族數據庫的特性。

把屬性放置在不同的列中也有助於大家能夠按照需求來劃分列族，以及使用編制索引來優化性能。

當然，使用復雜的數據結構沒有這些優勢。

7. 說出三種不應該使用輔助索引的情形。

1. 列中的基數值很少，索引則無助於提高性能，有時甚至還會損害性能

2. 列中的技術太多時

3. 許多數據行都沒有用到某個列時，針對該列編制輔助索引意義也不是很大

8. 統計學可以分為哪兩種？它們各自的用途是什麽？

統計學是數學的分支，研究如何描述大型數據集（總體），以及如何從數據中做出推論。

分為描述統計學

和預測統計學兩種。

描述統計學有助於我們理解數據的構成情況，也使得我們更加方便的將某個數據集與其他數據相對比。

預測統計學研究的是如何根據數據來做出預測。

9. 機器學習可以分為哪兩種？它們各自的用途是什麽？

機器學習所用的方法涉及其他很多學科，如計算機科學，人工智能，統計學，線性代數等。

有許多服務背後都有機器學習技術來支撐，如根據過往的購買行為向顧客推薦商品，檢測網絡欺詐行為，機器翻譯等。

包括

1. 非監督式學習，有助於我們探索龐大的數據集

2. 監督式學習使得程序能夠從樣例數據中學到一些知識

10. Spark 和 MapReduce 有什麽區別？

MapReduce 需要向磁盤中寫入大量數據， Spark 則需要占用很多內存。

MapReduce 采用一種比較固定的計算模型，先 map 後 reduce，而 Spark 使用的計算模型則更加通用一些。

列族數據庫的設計

全部大量數據 tro 實體數據表機器如果從數據 bsp 1. 與列族數據庫相關的設計要點列族數據庫應該事先成稀疏且多維的 map 在列族數據庫中，各個數據行所擁有的列是可以有所不同的列族數據庫的列是可以動態添加的列族數據庫不需要執行連接操作，需要對數據模型

數據庫設計之數據庫，數據表和字段等的命名總結

數據庫設計英文單詞數據表下劃線命名數據庫命名規則：根據項目的實際意思來命名。數據表命名規則：1.數據表的命名大部分都是以名詞的復數形式並且都為小寫；2.盡量使用前綴"table_"；3.如果數據表的表名是由多個單詞組成，則盡量用下劃線連接起來；但是不要超過30個字符，一旦超過3

VB.NET版機房收費系統—數據庫設計

階段數據類型多人不能 can log lai tex asi 之前第一遍機房收費的時候，用的數據庫是別人的。認知也僅僅能建立在別人的基礎上，等自考中《數據庫系統原理》這本書學完了之後，再去看曾經的數據庫，發現數據庫真的還須要進一步的優化。以下是我設計數據庫的

MySQL數據庫設計常犯的錯以及對性能的影響

成本 strong 操作主從相關解析依賴做的這樣的 1.過分的反範式化為表建立太多的列　　我們在設計數據庫的結構時，比較容易犯的第一個錯誤就是對表進行了過分的反範式化的設計，這就容易造成了表中的列過多，雖然說Mysql允許為一個表建立很多的列，但是由於Mysq

SQL筆記 --- 數據庫設計步驟(轉)

索引獨立 mem 數據庫應用 cat ati art 個學生 left 目錄總體設計過程需求分析概念結構設計邏輯結構設計數據庫物理設計數據庫實施數據庫運行和維護總體設計過程數據庫設計步驟:設計描述:數據庫設計不同階段形成的數據庫各級模式:數據庫設計的特點:需求分析分析和

數據庫設計--數據的垂直拆分

pad 最小由於 ria ont reads mic bytes 信息假設表字段太多。假設表中有些字段比較大。即便是你僅僅查有限的幾個字段，在做表關聯和全表掃的時候，由於掃描的數據塊多。性能方面還是會不理想。由於oracle掃描的時候是依照塊為單位掃描，

MVC排球計分（二）——需求分析與數據庫設計

logs 用例圖中國隊 eight 需求 back 過程 style .cn 需求分析和數據庫的設計是很重要的一個環節，這個環節會直接影響項目的開發過程和質量。這裏做的排球計分程序是一個例子，而且其業務極為簡單，因此，這裏並不是真正的需求分析和數據庫設計，而是將排球計

需求分析與數據庫設計（二）

-s size spa blog png 設計需求分析技術詳細需求分析：作為一名觀眾，我希望知道詳細的隊伍比分變化和隊伍得分信息，以便於了解比賽信息和運動員的精彩得分用例圖：數據庫設計：用mvc中自帶的數據庫SQL Server

ASP.NET MVC 排球計分程序（三）需求分析與數據庫設計

arch 情況 img 需求全場 ima 功能每次 str 需求分析：軟件名稱：排球計分程序 1、需要鍵入比賽人員的的姓名，需要根據場上的比賽結果及時做出操作，記分員可以在記錯的情況下撤銷上一部操作。比賽結束，記分員應能查詢到每個隊伍的進球情況，以及攔網、擊球等的

20170626_Oracle_數據庫設計

規劃小數標識符空間 com 第一個而不是 acl 原子數據庫設計的定義：規劃數據庫中數據對象以及之間關系的過程。為什麽進行數據庫設計？　　空間　　完整性　　程序開發數據庫設計前提知識：範式：　　1NF：第一範式　

6.7-數據庫設計，三大範式

上線 cnblogs 範式 spa 依賴軟件開發數據庫設計描述最小一、數據庫設計軟件開發：需求分析概要設計詳細設計代碼編寫測試上線部署

15套java互聯網架構師、高並發、集群、負載均衡、高可用、數據庫設計、緩存、性能優化、大型分布式項目實戰視頻教程

二階並發支持線程並發 important http 系統架構四十 mongodb入門 * { font-family: "Microsoft YaHei" !important } h1 { color: #FF0 } 15套java架構師、集群、高可用、高可擴

數據庫設計（理解篇）

國家 span 特性定義余數給定數據模型用戶數數據共享 1. 原始單據與實體之間的關系（原始單據可以理解為整個錄入界面的數據，這裏的實體可以理解為基本表）　　　可以是一對一、一對多、多對多的關系。　　　在一般情況下，它們是一對一的關系：即一張原始單據對應

關於數據庫設計三大範式

3-9 個數 logs 訂單根據添加原子 mage 分解　　為了建立冗余較小、結構合理的數據庫，設計數據庫時必須遵循一定的規則。在關系型數據庫中這種規則就稱為範式。範式是符合某一種設計要求的總結。要想設計一個結構合理的關系型數據庫，必須滿足一定的範式。　　在實際開

高性能可擴展MySQL數據庫設計及架構優化電商項目_1

電商一數據庫設計規範1 命名規範所有數據庫對象名稱必須用小寫字母並下劃線分割對象名稱禁止使用MySQL保留關鍵字命名要做到見名識義，不超過32字節臨時表必須tmp前綴日期後綴備份庫表bak前綴日期後綴所有存儲相同數據的列名和類型必須一致2 數據庫基本設計規範所有表必須用innodb引擎數據庫和表字符集

.NET—數據庫設計

post 轉換 con dsm 基本指令 pop gb2312 數據庫的操作 .NET視頻中講到了數據庫設計，整個聽下來，給我的感覺就是挺亂的。每一部分都聽得懂，可是好像又聯系不到一起的感覺。後來，總結了DBS才發現，事實上，東西都是一樣的，僅僅只是。打亂了順

[收集] 各式各樣的無限級分類的數據庫設計方案

where 數據庫位數 sel 其中三級 mat sco tiny 第一種方案：表為兩張，一張分類表，一張信息表。表1： `ID` int(10), `cID` tinyint(3) , `title` varchar(255), 表2：`cID` tinyint(

Exchange傳輸隊列queue數據庫越來越大怎麽辦？

exchange 傳輸隊列 queue 大家好，今天為大家分享一下日常管理中Exchange數據庫的一些維護操作。我們知道當我發送郵件時郵件都是先到一個Exchange的臨時的隊列數據庫中，然後再提交到用戶郵箱中。隨著時間的推移隊列數據庫大小會不斷的增加（查看傳輸隊列數據庫位置可以

項目開發規範，數據庫設計規範

好的變量 static date 規範 fff 識字 eas 表示 1.命名規範定義這個規範的目的是讓項目中全部的文檔都看起來像一個人寫的，添加可讀性。降低項目組中由於換人而帶來的損失。（這些規範並非一定要絕對遵守，可是一定要讓程序有良好的可讀性） 1.1

T-sql 行轉列，數據庫查詢分頁

tput substr between dep and alt rom img lec 1 USE [APS_Future_FT] 2 GO 3 /****** Object: StoredProcedure [dbo].[A_CrudePrice] Scr

列族數據庫的設計

1. 與列族數據庫相關的設計要點

2. 設計數據表格時需遵循的建議

3. 使用列族數據庫時怎樣才能避免執行連接操作？

4. 為什麽說實體應該建模成一個單獨的數據行？

5. 什麽叫做熱點現象(hotspotting), 為什麽應該避免這種現象？

6. 把復雜的數據結構用作列值會有哪些缺點？

7. 說出三種不應該使用輔助索引的情形。

8. 統計學可以分為哪兩種？它們各自的用途是什麽？

9. 機器學習可以分為哪兩種？它們各自的用途是什麽？

10. Spark 和 MapReduce 有什麽區別？

相關推薦