1. 程式人生 > 資訊 >哈佛與牛津開發基因致病性預測模型,現已成功預測 3600 萬個致命基因突變

哈佛與牛津開發基因致病性預測模型,現已成功預測 3600 萬個致命基因突變

1.什麼是資料倉庫

資料倉庫是面向主題的,整合的,和時間有關的,反應歷史資料變化的資料集合。是給使用者或者業務端提供策略支援的。

2.資料倉庫基本特性

  • 面向主題性:資料倉庫中的資料都是圍繞某一主題的
  • 資料的整合性:將源資料經過抽取,篩選,清洗,最終整合到資料倉庫中
  • 資料的時變性:資料隨著時間而變化,不斷生成主題的新快照
  • 資料的非易失性:資料倉庫中的資料只進行重新整理,不進行更新操作,反應歷史變化

3.資料倉庫的最終目的是

為使用者和業務部門提供決策支援

4.資料庫和資料倉庫的區別

  • 資料庫屬於業務資料庫,存的都是和業務相關的資料,對讀寫要求高,儲存的當前資料
  • 資料倉庫屬於分析型資料庫,是為使用者提供策略支援的,不要求寫的速度有多快,只要求大量資料複雜查詢的速度足夠快就行,會保留歷史資料

5.資料倉庫最重要的是什麼

資料整合和資料質量:因為資料倉庫的最終目的是給使用者提供策略支援的,而資料整合主要做的就是整合資料,依靠整合後的資料進行分析提供策略支援的。而且一定要保證資料的準確性