1. 程式人生 > >Pandora資料工廠之資料開發

Pandora資料工廠之資料開發

資料開發Leopard概述

資料開發Leopard根據使用者業務需求,對資料進行加工處理、分析與挖掘分析與挖掘(資料分析、資料探勘)等提供資料離線計算分析功能。把使用者設計的資料計算流程轉化為多個相互依賴的任務,供排程系統自動排程執行。

一、資料計算任務流程

在這裡插入圖片描述

二、任務型別
  • 資料同步

  • HiveSQL

  • SparkSQL

  • Shell

  • Spark Scala指令碼

我們對底層任務排程giantpanda封裝成資料整合和資料計算任務,具體參閱 2 任務排程

三、功能架構

在這裡插入圖片描述


原創詩詞一首

遊康定
鐵橋縱橫幾千秋,雲霧高鎖水難流。
貢嘎山上飄銀帶,新都湖水蕩輕舟。
遠至江北三千里,近接蜀南十四州。
日暮驅車何處去,夜長難眠使人愁