1. 程式人生 > >文字操作指令碼----shell和python哪個雞肋?

文字操作指令碼----shell和python哪個雞肋?

1.先看看文字,40多萬行的log資訊。處理要求:將第6列列印資訊tbmt:後面的數值按照十六進位制排序

2.shell指令碼如下圖,40萬行文字,指令碼沒關列印要執行6-8個小時左右才能處理完。

#! /bin/bash

# --------------------------------------------------------------------------------
# File name   : sort_beta.sh
# Date        : 2018/07/28
# Author      : Gick
# Mail        : [email protected]
# Usage : Sort the logFile in ascending # Version : 1.0 # -------------------------------------------------------------------------------- #################### test weather file exists or not ##################### if test -z "$1" then echo "please input your log_file!" exit 0 fi if test -z "$2" then echo "please input your log_file for storing the fixed data!" exit 0 fi #################### classified according to the length of string of last column ##################### cat $1 | while read line do echo $line > temp.txt ColumnData=`awk '{print $6}' ./temp.txt` echo $ColumnData ColumnData=`echo ${#ColumnData}` case $ColumnData in 6) echo "================= SIZE = 6 ====================" echo $line >> temp1.txt ;; 7) echo "================= SIZE = 7 ====================" echo $line >> temp2.txt ;; 8) echo "================= SIZE = 8 ====================" echo $line >> temp3.txt ;; 9) echo "================= SIZE = 6 ====================" echo $line >> temp4.txt ;; esac done #################### sort data of different string lengths separately ##################### echo "================= SIZE = 6 ====================" sort -k 6.6 temp1.txt > $2 echo "================= SIZE = 7 ====================" sort -k 6.6 temp2.txt >> $2 echo "================= SIZE = 8 ====================" sort -k 6.6 temp3.txt >> $2 echo "================= SIZE = 9 ====================" sort -k 6.6 temp4.txt >> $2 #################### remove temporary files ##################### rm temp*

3.再來看看python指令碼,執行時間未測,但應該比上面少。別人寫的,先mark,回頭學習,是時候轉python了。

相關推薦

文字操作指令碼----shellpython哪個雞肋

1.先看看文字,40多萬行的log資訊。處理要求:將第6列列印資訊tbmt:後面的數值按照十六進位制排序 2.shell指令碼如下圖,40萬行文字,指令碼沒關列印要執行6-8個小時左右才能處理完。 #! /bin/bash # -------------------

分別使用shellpython實現兩列排序

lines 相同 要求 open 並且 lam split shel join 有一個文件1.txt如下,要求使用shell和python實現排序,先按照第一列排序,第一列相同再按照第二列排序,並且輸出到另外一個文件2.txt LZdeMacBook-Pro:~ lz$ c

shellpython對比對目錄下不同文件

技術文檔cat git_tar.py import subprocess,tarfile,osdef finds():tar = tarfile.open("test.tar.gz","w:gz")result=subprocess.call(‘git diff 99g

ShellPython學習教程總結

shell fff 人生巔峰 地址 mark 總結 技術分享 python 因此 博友們好,由於運維相關技術不斷發展,個人能力也不斷提高,日常積累的經驗不能及時更新到以往的博文中。因此,為了更好的幫助大家學習運維技術,特地針對Shell和Python腳本語言總結了文檔,此文

shellpython獲取內網ip地址

1、shell命令:   linux:ifconfig|grep 'inet '|grep -v '127.0'|xargs|awk -F '[ :]' '{print $3}'   mac:ifconfig|grep 'inet '|grep -v '127.0'|xar

分別用ShellPython遍歷查詢Hdfs檔案路徑

1、使用Shell/Users/nisj/PycharmProjects/BiDataProc/getOssFileForDemo/getHdfsFilePath.sh#!/usr/bin/env b

運維中的日誌切割操作梳理(Logrotate/python/shell指令碼實現)

對於Linux系統安全來說,日誌檔案是極其重要的工具。不知為何,我發現很多運維同學的伺服器上都執行著一些諸如每天切分Nginx日誌之類的CRON指令碼,大家似乎遺忘了Logrotate,爭相發明自己的輪子,這真是讓人沮喪啊!就好比明明身邊躺著現成的性感美女,大家卻忙著自娛自樂,罪過!logrotate程式是一

如何在Windows下開發Python:在cmd下執行Python指令碼+如何使用Python Shell(command line模式GUI模式)+如何使用Python IDE

本文目的 希望對於,如何在Windows下,寫Python程式碼,進行Python開發,執行Python指令碼的人,看了此文後,懂得了: 什麼是cmd下面去執行Python指令碼; 什麼是Python的互動式的shell; 什麼是Python的IDE。 前提知識 看此文之前

如何利用Pythonwin32程式設計避免重複性體力勞動(三)——文字操作:WM_GETTEXT WM_SETTEXT

請移步至這裡以獲得更加的排版和閱讀體驗,謝謝您 Part 3:控制元件操作A 通過選單的目錄操作,我們打開了開啟檔案對話方塊。為了簡單起見,我們可以直接在檔名處填入要開啟檔案的絕對路徑。怎麼填呢? 首先還是定位到文字框控制元件 handle = find_sub

配置Apache2.x 支援shell指令碼Python編寫CGI程式+測試程式

1.安裝apache <span style="font-size:18px;">[email protected]:~$ aptitude search apache p apache2

#python# 操作文件目錄

級別 編寫一個程序 路徑 pre 找文件 練習 itext os.path 當前 總結於廖雪峰老師的python教程。 操作文件和目錄的函數一部分放在os模塊中,一部分放在os.path模塊中。 總結如下: 1 os.path.abspath(‘.‘)

python 操作文件目錄

變量 操作 mov tor pre copyfile 絕對路徑 當前 mon import os os.name # 操作系統名字 os.environ #版本 #要獲取某個環境變量的值,可以調用os.getenv()函數 os.getenv(‘PATH‘)

Python學習筆記__9.3章 操作文件目錄

編程語言 Python # 這是學習廖雪峰老師python教程的學習筆記1、概覽os模塊可以直接調用操作系統提供的接口函數。幫助我們在Python程序中對目錄和文件進行操作。操作文件和目錄的函數一部分放在os模塊中,一部分放在os.path模塊中但是復制文件的函數居然在os模塊中不存在,原因是復制文件

python 操作文件目錄 : os

ons max-width ping white string one webkit pri ubunt 導入模塊:import os顯示操作系統類型:os.nameposix顯示系統詳細信息:os.uname()posix.uname_result(sysname=

文件操作,路徑操作,StringIOBytesIO,序列化反序列化,正則表達式與python中使用

基於 關系 判斷目錄 java、 優先 errors 情況下 water des 文件操作 打開操作open(file, mode=‘r‘, buffering=-1, encoding=None, errors=None, newline=None, closefd=Tr

Windows正向綁定shell反向反彈shellPython代碼

反彈 RoCE 無法 效果 bre optparser eas rev all Windows下的shell原理 經過查閱資料,使用os.dup2(nfd, ofd)的方式重定向socket的輸入輸出到windows系統的cmd是無法做到的,屬於系統原因,不能直接復制Li

Python之IO編程——文件讀寫、StringIO/BytesIO、操作文件目錄、序列化

合並 new als 不錯 lse 絕對路徑 cin 容易 store IO編程 IO在計算機中指Input/Output,也就是輸入和輸出。由於程序和運行時數據是在內存中駐留,由CPU這個超快的計算核心來執行,涉及到數據交換的地方,通常是磁盤、網絡等,就需要IO接

使用IDLEPython Shell編寫python

轉載https://blog.csdn.net/shimengran107/article/details/70856242 1、IDLE(Python GUI)是一個功能完備的程式碼編輯器,允許在這個編輯器中編寫程式碼。 啟動IDLE時。會顯示“三個尖括號”提示符(>>>),可以輸入程

python簡單爬取網頁文字操作體會

自上次成功嘗試爬取了靜態頁面的圖片之後,本白又跟著另一篇博文做了一下爬取網頁文字的嘗試。基本程式碼都是來源於該篇博文,本人只是做了輕微修改。 簡單的實現爬蟲爬取網頁文字和圖片 以python3為背景,這裡還是先定義一個讀取html頁面資訊的函式: import urllib.

Python文字操作---資料篩選

1.匯入編碼模組 2.open():方法開啟文字 3.find():文字中找到相符和的值 4.write():寫入檔案 #字串檢索, #find函式找到返回位置 import codecs