根據uid計算使用者活躍日期及進行使用者日活分類

阿新 • • 發佈：2018-11-17

1、建表

drop table if exists oss_bi_all_type_of_dau101;
CREATE EXTERNAL TABLE `oss_bi_all_type_of_dau101`(
  `uid` bigint, 
  `newer_day` string, 
  `remain_day_num` int, 
  `parms` map<string,string>)
PARTITIONED BY (
  `pt_month` string, 
  `pt_day` string)
ROW FORMAT SERDE 
  'org.apache.hadoop.hive.serde2.lazy.LazySimpleSerDe' 
WITH SERDEPROPERTIES ( 
  'colelction.delim'='\u0002', 
  'mapkey.delim'='\u0003') 
STORED AS INPUTFORMAT 
  'org.apache.hadoop.mapred.TextInputFormat' 
OUTPUTFORMAT 
  'org.apache.hadoop.hive.ql.io.HiveIgnoreKeyTextOutputFormat'
LOCATION
  'hdfs:///emr-cluster/user/hive/warehouse/oss_bi_all_type_of_dau101';

2、新增分割槽及資料

alter table oss_bi_all_type_of_dau101 drop if exists partition (pt_month='2018-08',pt_day='2018-08-01');
alter table oss_bi_all_type_of_dau101 add partition (pt_month='2018-08',pt_day='2018-08-01') location 'oss://[ossKey]:[ossKeyVal]@chushou-hz.oss-cn-hangzhou-internal.aliyuncs.com/hive/oss_bi_all_type_of_dau101/2018-08/2018-08-01';

with tab_curr_dau as(
select pt_day,parms['uid'] uid
from oss_bi_all_jellyfish_log
where pt_day ='2018-08-01' and log_type=2 and parms['roomId']=101
group by pt_day,parms['uid']),
tab_his_dau as (
select uid,min(pt_day) newer_day
from oss_bi_all_type_of_dau101
where pt_day <'2018-08-01'
group by uid)
insert into oss_bi_all_type_of_dau101 partition (pt_month='2018-08',pt_day='2018-08-01')(uid,newer_day,remain_day_num,parms)
select a1.uid,case when a2.uid is null then a1.pt_day else a2.newer_day end newer_day,datediff(a1.pt_day,case when a2.uid is null then a1.pt_day else a2.newer_day end) remain_day_num,str_to_map('') parms
from tab_curr_dau a1
left join tab_his_dau a2 on a1.uid=a2.uid
;

3、說明
建表的時候可以設定儲存在hdfs上，在新增分割槽的時候可以將資料指定在oss上。
map空資料的insert into的方法，通過str_to_map('')方法來實現。
可以寫成python指令碼，進行順序排程；因為當天的資料依賴於昨天的資料跑出，所以必須序列排程。

根據uid計算使用者活躍日期及進行使用者日活分類

1、建表 drop table if exists oss_bi_all_type_of_dau101; CREATE EXTERNAL TABLE `oss_bi_all_type_of_dau101`( `uid` bigint, `newer_day` string,

根據生產日期和保質期計算食品過期日期

releaseDate表示食品出廠日期，day表示保質期，計算食品的過期日期，格式為yyyy-mm-dd。日期處理類：： a、java.util.Date類：public Date

根據PV計算頻寬及根據PV算併發

根據PV計算頻寬我們通常說的網站流量（traffic）就是指網站的訪問量，是用來描述訪問一個網站的使用者數量以及使用者所瀏覽的網頁數量等指標，常用的統計指標包括網站的獨立使用者數量、總使用者數量（含重複訪問者）、網頁瀏覽數量、每個使用者的頁面瀏覽數量、使用者在網站的平均停

new Date 計算出當前日期後n天的日期以及根據兩個日期，計算出一共經歷了幾天 (包含了在ie和火狐中的相容)

1、計算出當前日期後n天的日期 getAfterFormatDate (days) { // 如果需要計算當前的日期傳 0 即可 (此例是考慮時分秒的情況) let dd = new Date() dd.setDate(dd.ge

Android獲取日期及星期的方法

ext text () oid get erro pre 公歷 format Calendar calendar=Calendar.getInstance(); SimpleDateFormat simpleDateFormat=new SimpleDateFormat("

最全面的Java字節byte操作,處理Java基本數據的轉換及進制轉換操作工具,流媒體及java底層開發項目常用工具類

進制 string 常用工具類 cat i++ logs 指定位置 tput off 前言：用於處理Java基本數據的轉換及進制轉換操作工具一、實現功能 1、int預byte互轉 2、int與byte[]互轉 3、short與byte互轉 4、short與byte[]互轉

Oracle中計算兩個日期時間的差

weight span num log 方法 bsp round code oracl --方法1 select floor((sysdate - to_date(‘2006-09-01 08:00:00‘, ‘yyyy-mm-dd hh24:m

進程及進程的管理

進程的管理首先得理解進程的含義，進程不同於程序，進程是程序的一次運行實例，當一個程序運行時，就會產生相應的進程，因此，程序是死的，而進程是活的。一個進程可以包含若幹線程，線程可以幫助應用程序同時做幾件事(比如一個線程向磁盤寫入文件，另一個則接收用戶的按鍵操作並及時做出反應，互相不幹擾)，在程序被運行後中，

linux環境下關於顯示日期及修改密碼的小練習

一只小菜鳥的成長1.顯示1984-11-18是1984年的第幾天 2.顯示當前的日期 ##上面是兩種不同的表現形式## 3.在超級用戶下修改student用戶的密碼，並且student用戶在第一次登錄後強制修改密碼 ## passwd -e ## 強制修改密碼##註意：當使用root用戶修改其他用戶密

javascript計算兩個日期（date）對象的時間差

bsp 個數字 new tar asc nbsp art span var var st1 = "2008-8-1 8:50:01"; var st2 = "2008-8-3 8:50:01"; var time1 = new Date(st1);

【峰回路轉】Excel技巧百例 08.計算兩個日期的差值

b2c font date trac con 進行 size 高速 http 在Excel中假設高速計算兩個日期之間的差？比如A日期為：2012/3/12 B日期為：2015/7/29 那麽這兩個日期之間差幾年，差幾個月。差多少天？我們使用DateDif 函數來處

java根據身份證計算年齡

integer 計算 minus static get ins calendar bstr spa /** * 根據身份證計算年齡 * * @param idcard * @return */ public stat

計算兩個日期之間的天數差C++/java

new abs ear == 關於 ostream logs col 多少 1--Java 分析：調用java中Calendar類 int days(Date date1,Date date2){ 　　Calendar cal = new Calendar.getInst

jsonConfig處理日期及對象級聯問題

class text util big view small 構造 count == 項目中經常用到ajax請求後臺，返回給前臺json對象字符串。有些實體包含字段可能有日期、list、以及級聯對象情況。因此，我們需要有針對性處理，例如日期date類型，我們要

路由配置及進程管理

路由本文出自 “13280264” 博客，轉載請與作者聯系！路由配置及進程管理

【Vue實戰之路】一、Vue-cli全面詳解及進階操作。

image 腳本 js基礎這一命令執行 bsp row 編譯服務器全面的Vue-cli學習，這一篇就夠了！一、下載使用vue-cli前，需先安裝node.js,node的安裝就不贅述，不過在此需要註意： 1. node版本需在4.x以上，首推6.x以上版本

js獲取某周、某月、下月、某季度的開始日期、結束日期及判斷日期第幾周

weekend return n) nth 結束時間 value rst 獲得 set //格式化日期：yyyy-MM-dd　　 function formatDate(date) {　　　　 var myyear = date.getFullYear();　　　 v

顯示日期及星期

blog val 月份 func set var () spa nbsp // 顯示日期 function current(){ var d=new Date(),str=‘‘; var weekday=new Array(7)

進程及進程調度

沒有用戶 wake 進程詳細虛擬存儲器區域內存區域服務 1 .1 進程結構每個進程都具有自己的屬性，用一個task_struct數據結構來表示，它包含了進程的詳細信息，主要有進程標識符（PID）、進程所占的內存區域、相關文件描述符、安全信息、進程環境、信號處理

實現:判斷日期之間關系(相交,相離,重合),得到相交重合的天數以及計算兩個日期相差的天數

數值以及 c++ 日期類 OS 錯誤表達單位有一個 package com.xiawei.repeatdays; import java.util.Date; /** * 判斷日期之間關系(相交,相離,重合),得到相交重合的天數 * */public class R

根據uid計算使用者活躍日期及進行使用者日活分類

相關推薦