shell加python實現程式自動化控制

阿新 • • 發佈：2019-02-12

為做到資料的實時傳輸（實時：當前時間傳輸上一個小時的資料），shell用於控制整個流程，python用於處理資料。

shell程式碼如下：

#bin/bash
#########
##   篤篤學車4G執行指令碼
##   編寫者：zhangqm
##   日期：2018-04-04
##   呼叫方式：nohup sh duduxueche.sh day/hour > ../log/duduxueche.log 2>&1 &
##   type資料有兩種：1、day：按天跑 2、hour:按小時跑  
########

# 程式的日誌目錄
log='/data1/u_lx_data/zhangqm/yanjie/dudu/log'

# 4G表的HDFS目錄
sourceDataHdfs='/user/db_lte/public/sada_lte_xdr03_103'

# MR清單資料，HDFS目錄
mrDataListHdfs='/user/u_lx_data/private/zhangqm/dudu'

# MR清單資料,本地目錄
dataList='/data1/u_lx_data/zhangqm/yanjie/dudu/data'

# 結果資料
resultList='/data1/u_lx_data/zhangqm/yanjie/dudu/result'


# 稽核語句
# 呼叫方式：Check_num 目錄 時間 小時
function Check_num()
{
  if [ $3 == 'day' ];then
     num=$(hadoop fs -du -h -s $1/$2 |awk -F" " '{print $1}'|sed 's/ //g')
	   echo $num
  else
	   num=$(hadoop fs -du -h -s $1/$2/$3|awk -F" " '{print $1}'|sed 's/ //g')
	   echo $num
  fi
}	

# 得到清單資料
# 呼叫方式：Deal_data 時間 小時
function Deal_data()
{
  if [ $2 == 'day' ];then
     # 拉清單資料
     echo '開始處理'${dayTime_1}'天資料。。。'
     hadoop jar dudu4g_0514.jar ${sourceDataHdfs}/$1/ ${mrDataListHdfs}/$1
     # 檢查天資料是否產生
     size=$(Check_num ${mrDataListHdfs} $1 $2)
     if [ ${size} > 0 ] ; then 
        hadoop fs -cat ${mrDataListHdfs}/$1/* > ${dataList}/$1.txt
     else
        echo '天資料沒有產生，請核查。。。'
     fi
  else
	   # 拉清單資料
	   echo '開始處理'${dayTime}${hourTime_1}'小時資料。。。'
     hadoop jar dudu4g_0514.jar ${sourceDataHdfs}/$1/$2 ${mrDataListHdfs}/$1/$2
     # 檢查小時資料是否產生
     size=$(Check_num ${mrDataListHdfs} $1 $2)
     if [ ${size} > 0 ] ; then 
        if [ ! -d ${dataList}/$1 ];then
           mkdir ${dataList}/$1
        fi
        hadoop fs -cat ${mrDataListHdfs}/$1/$2/* > ${dataList}/$1/$2.txt
     else
        echo '當前小時資料沒有產生，請核查。。。'
     fi
  fi
}	

#按小時跑
function Run_hour()
{
    while true
    do
         # 獲取系統當前時間
         dayTime=$(date +"%Y%m%d" )
    
         # 獲取系統當前小時的前1小時的小時
         hourTime_1=$(date -d "-1 hour" +"%H")
         
         if [ ${hourTime_1} -eq 23 ];then
            dayTime=$(date -d "-1 day " +"%Y%m%d")
         fi
         
         # 測試小時資料是否已經產生
         hadoop fs -test -e ${mrDataListHdfs}/${dayTime}/${hourTime_1}
         
         #十五分鐘檢測一次，主要是解決跑程式所花費的時間不同問題
         if [ $? -eq 0 ] ;then 
            echo '******************************************'  
            echo ${dayTime}${hourTime_1}'小時已經跑過。。。。' 
            echo '等待十五分鐘。。。。。'
            sleep 900
            echo '當前時間為：'$(date +"%Y-%m-%d %H:%M")
            
         else 
            echo '******************************************' 
            echo ${dayTime}${hourTime_1}'小時沒有跑過。。。。'
            echo '當前時間為：'$(date +"%Y-%m-%d %H:%M")
            Deal_data ${dayTime} ${hourTime_1}
    
            if [ ! -d ${resultList}/${dayTime} ];then
               mkdir ${resultList}/${dayTime}
            fi
            
            echo '得到結果資料,當前時間為：'$(date +"%Y-%m-%d %H:%M")
            python duduxueche.py ${dataList} ${dayTime} ${hourTime_1} ${resultList}
            echo ${dayTime}${hourTime_1}'小時全部結束，進入下一個小時的處理。。。。'
            
            #把70的資料結果放到231的HDFS上
            ./duduxueche.exp ${resultList} ${dayTime} ${hourTime_1}
         fi  
        # exit 2
    done
}

#按天跑
function Run_day()
{
    while true
    do
         # 獲取系統當前時間
         dayTime=$(date +"%Y%m%d" )
    
         # 獲取系統時間的前一天的時間
         dayTime_1=$(date -d "-1 day $dayTime" +"%Y%m%d")
         
         # 測試天資料是否已經產生
         hadoop fs -test -e ${mrDataListHdfs}/${dayTime_1}
         
         #8小時檢測一次，主要是解決跑程式所花費的時間不同問題
         if [ $? -eq 0 ] ;then 
            echo '******************************************'  
            echo ${dayTime_1}'天已經跑過。。。。' 
            echo '等待8個小時。。。。。'
            sleep 28800
            echo '當前時間為：'$(date +"%Y-%m-%d %H:%M")
            
         else 
            echo '******************************************' 
            echo ${dayTime_1}'天沒有跑過。。。。'
            echo '當前時間為：'$(date +"%Y-%m-%d %H:%M")
            Deal_data ${dayTime_1} $1
    
            #if [ ! -d ${resultList}/${dayTime} ];then
             #  mkdir ${resultList}/${dayTime}
            #fi
            
            echo '得到結果資料,當前時間為：'$(date +"%Y-%m-%d %H:%M")
            python duduxueche.py ${dataList} ${dayTime} ${hourTime_1} ${resultList}
            #echo ${dayTime}${hourTime_1}'小時全部結束，進入下一個小時的處理。。。。'
            
            # 把70的資料結果放到231的HDFS上
            #./duduxueche.exp ${resultList} ${dayTime} ${hourTime_1}
         fi  
        # exit 2
    done
}

if [ $1 == 'hour' ] ;then
   Run_hour
else
   Run_day $1
fi

Python程式碼如下：

# -*- coding:utf-8 -*-
from datetime import datetime
import pandas as pd
import sys
#*****************
##按口徑出的phone結果
# 口徑：1）關鍵詞且官網 2）關鍵詞且app 3）關鍵詞訪問大於1 4）官網訪問大於1
#*****************
def Main():
    dataList = sys.argv[1]+"/"+ sys.argv[2]+"/"+sys.argv[3]+".txt"
    # 對照表清單資料(加密和不加密手機號對應關係)
    mapRuletxt = sys.argv[1]+"/"+"mapRuletxt.txt"
    targetTxt = sys.argv[4]+"/"+ sys.argv[2]+"/"+sys.argv[3]+".txt"
    # 儲存最終解果
    phoneSet = set()
    # 儲存有關鍵詞行為的phone
    kwPhoneSet = set()
    # 儲存有官網行為的phone
    webPhoneSet = set()
    # app行為
    appPhoneSet = set()
    #儲存對照表清單資料
    dict={}
    uname = ['phone', 'time', 'name']
    # 找官網的資料
    def web(str):
        if str.find('app') == -1 and str.find('kw') == -1:
            return str
    print("開始。。。。。")
    print(datetime.now().strftime('%Y-%m-%d %H:%M:%S'))

    with open(mapRuletxt,'r') as fr:
        for line in fr:
            line = line.strip().split("\t")
            dict[line[1]] = line[0]
    with open(dataList,'r') as fr:
        for line in fr:
            line = line.strip().split("\t")
            if line[2].find('app') != -1: # app的
                appPhoneSet.add(line[0])
            elif line[2].find('kw') != -1: #關鍵詞搜尋的
                kwPhoneSet.add(line[0])
            else: # 官網訪問行為的
                webPhoneSet.add(line[0])
    # 有過關鍵詞搜尋行為且有過官網訪問行為的phone
    for kwphone in kwPhoneSet:
        if kwphone in webPhoneSet:
            phoneSet.add(kwphone)
    # 有過關鍵詞搜尋行為且有過app行為的phone
    for kwphone in kwPhoneSet:
        if kwphone in appPhoneSet:
            phoneSet.add(kwphone)
    # 關鍵詞訪問大於1的phone
    df = pd.read_table(dataList, sep="\t", header=None, names=uname, index_col=False)[['phone', 'name']]
    kw = df[df.name.str.contains('kw')].groupby('phone')['name'].agg([('uv',pd.Series.nunique)]).reset_index()
    for phone in  kw[kw.uv > 1]['phone']:
        phoneSet.add(phone)
    # 官網訪問大於1的phone
    web = df.applymap(web).dropna().groupby('phone')['name'].agg([('uv',pd.Series.nunique)]).reset_index()
    for phone in  web[web.uv > 1]['phone']:
        phoneSet.add(phone)
    with open(targetTxt,'w+') as fw:
        for phone in phoneSet:
            if phone in dict:
                fw.write(dict[phone]+"\n")
    print("結束。。。。。")
    print(datetime.now().strftime('%Y-%m-%d %H:%M:%S'))
if __name__ == "__main__":
    Main()

shell加python實現程式自動化控制

為做到資料的實時傳輸（實時：當前時間傳輸上一個小時的資料），shell用於控制整個流程，python用於處理資料。shell程式碼如下：#bin/bash ######### ## 篤篤學車4G執行指令碼 ## 編寫者：zhangqm ## 日期：2018-04-

分別使用shell和python實現兩列排序

lines 相同要求 open 並且 lam split shel join 有一個文件1.txt如下，要求使用shell和python實現排序，先按照第一列排序，第一列相同再按照第二列排序，並且輸出到另外一個文件2.txt LZdeMacBook-Pro:~ lz$ c

selenium+python—實現基本自動化測試

set teardown 逗號元素定位 acc AC dex 詳情構造方法安裝selenium 打開命令控制符輸入：pip install -U selenium 火狐瀏覽器安裝firebug：www.firebug.com，調試所有網站語言，調試功能 Seleniu

【Selenium+Python實現WEB自動化測試】000_先隨便聊聊

閒聊自我介紹逮嘎猴，我是安叔。其實年紀沒那麼大，被人叫叔是因為大學時的一個梗，後來叫著叫著也習慣了。我自己挺喜歡被人叫叔的，也喜歡自稱叔，家有大叔初養成。並沒有佔便宜的意思。部落格簡述為什麼開始寫部落格？大概因為兩點吧。一是對自己近一兩年學習的技能總

【Selenium+Python實現WEB自動化測試】001_自動化環境準備

叔是個俗人，不懂用“工欲善其事必先利其器”之類的話來給系列部落格開篇。只能說，環境搭建是繞不開的各位老鐵，必須先講環境怎麼弄。幸運的是，Selenium環境比Appium弄起來簡單多了。作業系統 Windows7旗艦版。瀏覽器準備系列博文都是基於Chro

11、Selenium + Python 實現 UI 自動化測試-操作按鈕、複選框

一、按鈕 input type=button .click()方法，實現點選按鈕功能 from selenium import webdriver from time import sleep

26、Selenium + Python 實現 UI 自動化測試-呼叫 JavaScript 操作滾動條

前面我們學了 JavaScript 基礎、JS DOM等知識，也在Selenium中呼叫過一次 JavaScript 指令碼實現滑動頁面滾動條。那在 Selenium 自動化的過程中，都有哪些呼叫

Python實現測試自動化

#b233d69d7d84 import uiautomator2 as u2 import time d=u2.connect('172.21.236.63') """ d(description=u"第2屏").click() #開啟趣頭條 d(resourceId="com.miui.home

12、Selenium + Python 實現 UI 自動化測試-操作下拉列表

Selenium 提供了Select 包，讓我們方便的操作下拉列表一、先來看下下拉列表Select 的元素屬性二、對下拉列表操作步驟 1、首先需要從selenium匯入select的方法：f

如何使用 Python 實現網頁自動化朗讀？

作者 | hoxis責編 | 郭芮是不是有的時候懶得自己看新聞？那麼不妨試試用 Python 來

python實現介面自動化框架前言-----介面的介紹

先介紹一下介面：首先我們需要了解兩個東西：1.什麼是介面。 2.介面是怎麼進行互動的，有哪幾種方式。先回答第一個問題：舉個例子，比如一個查詢，如圖：在這個查詢中我們看到有5個input(輸入

python實現微信控制電腦

可用微信中的檔案傳輸助手控制cmd命令，如電腦關機，檢視當前使用電腦的使用者的照片等。程式程式碼： import itchat import os import time import cv2 sendMsg = u"{訊息助手}：暫時無法回覆" usage

17、Selenium + Python 實現 UI 自動化測試-等待

原文地址：http://blog.csdn.net/huilan_same/article/details/52544521 作者這篇文章寫的很詳細，很經典，就不再重新寫了。總結一下： 1、強制等

中國有句俗語叫“三天打魚兩天晒網”。某人從2010年1月1日起開始“三天打魚兩天晒網”，問這個人在以後的某一天中是“打魚”還是“晒網”。用C或C++語言/java/python實現程式解決問題。

提高要求：1.輸入資料的正確性驗證。 2.使用檔案進行資料測試。如將日期 20100101 20111214 等資料儲存在in.txt檔案中，程式讀入in.dat檔案進行判定，並將結果輸出至out.txt檔案。 import java.io.Bu

16、Selenium + Python 實現 UI 自動化測試-其它彈窗

事實上，由於Alert 彈窗不美觀（樣式不好修改），實際專案中大多數網頁的彈框都是開發們好心自己做的（UI 設計的）。來看看非Alert 類的彈窗吧！一、Windows瀏覽器視窗 1、我們點選某

Python實現瀏覽器自動化操作

程式碼－－－－－－－－－－－－－－－－－－－－－－－－－－－－－－－－－－－－－－－－#coding=utf-8import timefrom splinter import Browserdef splinter(url): browser = Browser('chrome') #login 126 em

23、Selenium + Python 實現 UI 自動化測試-檔案上傳

首先，我們要區分出上傳按鈕的種類，大體上可以分為兩種，一種是input框，另外一種就比較複雜，通過js、flash等實現，標籤非input 一、input 標籤示例網址：http://sahitest.com/demo/php/fileUpload.htm 網頁如下：

Python實現效能自動化測試竟然如此簡單

一、思考❓❔ 1.什麼是效能自動化測試? 效能系統負載能力超負荷執行下的穩定性系統瓶頸自動化測試使用程式代替手工提升測試效率效能自動化使用程式碼模擬大批量使用者讓使用者併發請求多頁面多使用者併發請求採集引數，統計系統負載能力生成報告 2.Python中的效能自動化

Python實現可控制肉雞的反向Shell

Server（控制端）控制端需要實現等待被控端連線、給被控端傳送Shell命令，並且可以選擇和切換當前要接收Shell命令的肉雞（被控端）。所以，首先我們需要建立一個socket物件，並監聽7676埠，程式碼如下： s = socket.socket(sock

Appium 新手貼:Windows 平臺上的使用 Python 語言實現 appium 自動化程式 for Android (完整版)

https://testerhome.com/topics/646 前面寫了個《新手貼:Windows 平臺上的使用 Java 語言實現 appium 自動化程式 for Android（完整版）》的帖子：http://testerhome.com/topics/645

shell加python實現程式自動化控制

相關推薦