python操作txt檔案中資料教程[2]-python提取txt檔案

阿新 • • 發佈：2018-11-26

python操作txt檔案中資料教程[2]-python提取txt檔案中的行列元素

覺得有用的話,歡迎一起討論相互學習~Follow Me

原始txt檔案
程式實現後結果-將txt中元素提取並儲存在csv中

程式實現

import csv

filename = "./test/test.txt"
Sum_log_file = "./test/sumlog_test.csv"
Individual_log_file = "./test/Individual_test.csv"
DNA_log = []  # 精英種群個體日誌mod9=1-8
Sum_log = []  # 精英種群總體日誌mod9=0
DNA_Group = 7  # 表示每7條DNA組成一個組
# NO+'Sum 45.0 0.0 436.0 364.0 20.0\n'中屬性一共6個屬性，，則設為8列的二維陣列
sum_evaindex = [[] for i in range(6)]
# 個體有8個屬性，則設為8列的二維陣列
Individual_evaindex = [[] for i in range(8)]

# 將txt中檔案資訊儲存到Sum_log和DNA_log列表中
with open(filename, 'r') as f:
    i = 1
    for line in f.readlines():
        if i%9 == 0:
            Sum_log.append(line)
        else:
            DNA_log.append(line)
        i = i + 1
f.close()
# print(Sum_log)
# print(DNA_log)

# ['Sum 45.0 0.0 436.0 364.0 20.0\n', 'Sum 27.0 3.0 398.0 394.0 25.0\n', 'Sum 45.0 0.0 384.0 394.0 30.0']
# ['1\n', 'AAACAAGGAACAAACGCACA 18.0 0.0 58.0 50.0 52.5552 10.0\n', 'AAAGGACACAGTGAGAGACG 9.0 0.0 60.0 52.0 48.662 0.0\n',
#  'AGCCATTGTCGAGTCCGTTA 0.0 0.0 63.0 50.0 48.4427 0.0\n', 'GTGGTCACTCCTCGCAAATT 9.0 0.0 64.0 56.0 48.9881 0.0\n',
#  'TTCAACCATACAGGCCTCGT 0.0 0.0 63.0 53.0 48.9355 0.0\n', 'CAAATGTGAGGATTCGGACG 9.0 0.0 63.0 53.0 50.8708 0.0\n',
#  'CCGTGGTGAACTGGAGCGTT 0.0 0.0 65.0 50.0 44.924 10.0\n', '2\n', 'AAAGGACACAGTGAGAGACG 9.0 0.0 53.0 58.0 48.662 0.0\n',
#  'AGCCATTGTCGAGTCCGTTA 0.0 0.0 60.0 57.0 48.4427 0.0\n', 'CCACAACGCTCGAAGGCAAG 0.0 0.0 59.0 54.0 44.7269 10.0\n',
#  'AAGTACAGCGGGCCAATAGC 9.0 0.0 56.0 58.0 47.2114 5.0\n', 'CAAATGTGAGGATTCGGACG 9.0 0.0 59.0 53.0 50.8708 0.0\n',
#  'GAGAACGTTGAGTGAGCGTG 0.0 0.0 60.0 57.0 46.9033 5.0\n', 'GATGTTAAGTAGAGCAGAGG 0.0 3.0 51.0 57.0 52.383 5.0\n', '3\n',
#  'AAACAAGGAACAAACGCACA 18.0 0.0 45.0 57.0 52.5552 10.0\n', 'AAAGGACACAGTGAGAGACG 9.0 0.0 52.0 59.0 48.662 0.0\n',
#  'CCACAACGCTCGAAGGCAAG 0.0 0.0 52.0 60.0 44.7269 10.0\n', 'AAGTACAGCGGGCCAAGATC 9.0 0.0 54.0 56.0 46.8607 5.0\n',
#  'CTCAGAAGATCTCGATGGCT 0.0 0.0 63.0 53.0 47.5395 0.0\n', 'AGCCATTGTCGAGTCCGTTA 0.0 0.0 63.0 52.0 48.4427 0.0\n',
#  'TGCCGCAAACTACACACACG 9.0 0.0 55.0 57.0 47.45 5.0\n']

# 遍歷行，並將列屬性儲存到對應列中
Sum_no = 1
for Sum in Sum_log:
    # print(Sum.split("\n")[0].split(" ")[1:])
    # ['45.0', '0.0', '436.0', '364.0', '20.0']
    # ['27.0', '3.0', '398.0', '394.0', '25.0']
    # ['45.0', '0.0', '384.0', '394.0', '30.0']
    sum_eva_index = Sum.split("\n")[0].split(" ")[1:]
    sum_evaindex[0].append(int(Sum_no))
    sum_evaindex[1].append(float(sum_eva_index[0]))  # Con
    sum_evaindex[2].append(float(sum_eva_index[1]))  # HP
    sum_evaindex[3].append(float(sum_eva_index[2]))  # Hm
    sum_evaindex[4].append(float(sum_eva_index[3]))  # Si
    sum_evaindex[5].append(float(sum_eva_index[4]))  # GC
    Sum_no = Sum_no + 1
# print(sum_evaindex[0])  # [45.0, 27.0, 45.0]


# 遍歷個體資訊，並將其儲存到Individual_evaindex列表中
dna_log_no = 0
for dna_log in DNA_log:
    if (dna_log_no + 1)%8 == 1:
        # print(int(dna_log.split("\n")[0]))
        # 以列儲存序號值，並且重複DNA_Group次
        for i in range(DNA_Group):
            Individual_evaindex[0].append(int(dna_log.split("\n")[0]))
    else:
        Individual_evaindex[1].append(dna_log.split("\n")[0].split(" ")[0])  # 所有DNA序列全部記載,使用原有的str字串型別記載
        Individual_evaindex[2].append(float(dna_log.split("\n")[0].split(" ")[1]))  # DNA序列的連續值Con,注意要轉換為浮點數型別
        Individual_evaindex[3].append(float(dna_log.split("\n")[0].split(" ")[2]))  # Hp莖區匹配
        Individual_evaindex[4].append(float(dna_log.split("\n")[0].split(" ")[3]))  # H-measure
        Individual_evaindex[5].append(float(dna_log.split("\n")[0].split(" ")[4]))  # Similarity
        Individual_evaindex[6].append(float(dna_log.split("\n")[0].split(" ")[5]))  # TM
        Individual_evaindex[7].append(float(dna_log.split("\n")[0].split(" ")[6]))  # GC

    dna_log_no = dna_log_no + 1
# print(Individual_evaindex[0]) #[1, 1, 1, 1, 1, 1, 1, 1, 2, 2, 2, 2, 2, 2, 2, 2, 3, 3, 3, 3, 3, 3, 3, 3]
# print(Individual_evaindex[1])
# print(Individual_evaindex[2])
# print(Individual_evaindex[3])
# print(Individual_evaindex[4])
# print(Individual_evaindex[5])
# print(Individual_evaindex[6])
# print(Individual_evaindex[7])
# ['AAACAAGGAACAAACGCACA', 'AAAGGACACAGTGAGAGACG', 'AGCCATTGTCGAGTCCGTTA', 'GTGGTCACTCCTCGCAAATT', 'TTCAACCATACAGGCCTCGT',
#  'CAAATGTGAGGATTCGGACG', 'CCGTGGTGAACTGGAGCGTT', 'AAAGGACACAGTGAGAGACG', 'AGCCATTGTCGAGTCCGTTA', 'CCACAACGCTCGAAGGCAAG',
#  'AAGTACAGCGGGCCAATAGC', 'CAAATGTGAGGATTCGGACG', 'GAGAACGTTGAGTGAGCGTG', 'GATGTTAAGTAGAGCAGAGG', 'AAACAAGGAACAAACGCACA',
#  'AAAGGACACAGTGAGAGACG', 'CCACAACGCTCGAAGGCAAG', 'AAGTACAGCGGGCCAAGATC', 'CTCAGAAGATCTCGATGGCT', 'AGCCATTGTCGAGTCCGTTA',
#  'TGCCGCAAACTACACACACG']
# [18.0, 9.0, 0.0, 9.0, 0.0, 9.0, 0.0, 9.0, 0.0, 0.0, 9.0, 9.0, 0.0, 0.0, 18.0, 9.0, 0.0, 9.0, 0.0, 0.0, 9.0]
# [0.0, 0.0, 0.0, 0.0, 0.0, 0.0, 0.0, 0.0, 0.0, 0.0, 0.0, 0.0, 0.0, 3.0, 0.0, 0.0, 0.0, 0.0, 0.0, 0.0, 0.0]
# [58.0, 60.0, 63.0, 64.0, 63.0, 63.0, 65.0, 53.0, 60.0, 59.0, 56.0, 59.0, 60.0, 51.0, 45.0, 52.0, 52.0, 54.0, 63.0, 63.0,
#  55.0]
# [50.0, 52.0, 50.0, 56.0, 53.0, 53.0, 50.0, 58.0, 57.0, 54.0, 58.0, 53.0, 57.0, 57.0, 57.0, 59.0, 60.0, 56.0, 53.0, 52.0,
#  57.0]
# [52.5552, 48.662, 48.4427, 48.9881, 48.9355, 50.8708, 44.924, 48.662, 48.4427, 44.7269, 47.2114, 50.8708, 46.9033,
#  52.383, 52.5552, 48.662, 44.7269, 46.8607, 47.5395, 48.4427, 47.45]
# [10.0, 0.0, 0.0, 0.0, 0.0, 0.0, 10.0, 0.0, 0.0, 10.0, 5.0, 0.0, 5.0, 5.0, 10.0, 0.0, 10.0, 5.0, 0.0, 0.0, 5.0]


Sum_log_file_header = ["No", "Continuity", "Hairpin", "H-measure", "Similarity", "GC"]
# 將資料寫入csv日誌檔案中
with open(Sum_log_file, "w", newline='') as f:
    writer = csv.writer(f)
    writer.writerow(Sum_log_file_header)  # 注意，此處使用writerow而不是使用writerows
    for i in range(sum_evaindex[0][-1]):  # i 取(0,1,2)
        writer.writerow(
            [sum_evaindex[0][i], sum_evaindex[1][i], sum_evaindex[2][i], sum_evaindex[3][i], sum_evaindex[4][i],
             sum_evaindex[5][i]])
    f.close()
Individual_log_file_header = ["No", "DNAstructure", "Continuity", "Hairpin", "H-measure", "Similarity", "TM", "GC"]
with open(Individual_log_file, "w", newline='') as f:
    writer = csv.writer(f)
    writer.writerow(Individual_log_file_header)  # 注意，此處使用writerow而不是使用writerows
    for i in range(sum_evaindex[0][-1]*DNA_Group):
        writer.writerow(
            [Individual_evaindex[0][i], Individual_evaindex[1][i], Individual_evaindex[2][i], Individual_evaindex[3][i],
             Individual_evaindex[4][i], Individual_evaindex[5][i], Individual_evaindex[6][i],
             Individual_evaindex[7][i]])
    f.close()

測試版本

filename = "./test.txt"
DNA_log = []  # 精英種群個體日誌mod9=2-8
Sum_log = []  # 精英種群總體日誌mod9=0
Num_log = []  # 序號日誌mod9=1
Num_int = []  # 擷取序號為int型別
sum_evaindex = [[] for i in range(5)]
Individual_evaindex = [[] for i in range(8)]
with open(filename, 'r') as f:
    i = 1
    for line in f.readlines():
        if i%9 == 1:
            Num_log.append(line)
        elif i%9 == 0:
            Sum_log.append(line)
        else:
            DNA_log.append(line)
        i = i + 1
f.close()
print(Num_log)
print(Num_log[1])  # 其中存著的不是數字1,而是字串'2\n',所以會有空行的情況
# ['1\n', '2\n', '3\n']
# 2
#
#
print(Sum_log)
print(DNA_log)

# ['Sum 45.0 0.0 436.0 364.0 20.0\n', 'Sum 27.0 3.0 398.0 394.0 25.0\n', 'Sum 45.0 0.0 384.0 394.0 30.0']
# ['AAACAAGGAACAAACGCACA 18.0 0.0 58.0 50.0 52.5552 10.0\n', 'AAAGGACACAGTGAGAGACG 9.0 0.0 60.0 52.0 48.662 0.0\n',
#  'AGCCATTGTCGAGTCCGTTA 0.0 0.0 63.0 50.0 48.4427 0.0\n', 'GTGGTCACTCCTCGCAAATT 9.0 0.0 64.0 56.0 48.9881 0.0\n',
#  'TTCAACCATACAGGCCTCGT 0.0 0.0 63.0 53.0 48.9355 0.0\n', 'CAAATGTGAGGATTCGGACG 9.0 0.0 63.0 53.0 50.8708 0.0\n',
#  'CCGTGGTGAACTGGAGCGTT 0.0 0.0 65.0 50.0 44.924 10.0\n', 'AAAGGACACAGTGAGAGACG 9.0 0.0 53.0 58.0 48.662 0.0\n',
#  'AGCCATTGTCGAGTCCGTTA 0.0 0.0 60.0 57.0 48.4427 0.0\n', 'CCACAACGCTCGAAGGCAAG 0.0 0.0 59.0 54.0 44.7269 10.0\n',
#  'AAGTACAGCGGGCCAATAGC 9.0 0.0 56.0 58.0 47.2114 5.0\n', 'CAAATGTGAGGATTCGGACG 9.0 0.0 59.0 53.0 50.8708 0.0\n',
#  'GAGAACGTTGAGTGAGCGTG 0.0 0.0 60.0 57.0 46.9033 5.0\n', 'GATGTTAAGTAGAGCAGAGG 0.0 3.0 51.0 57.0 52.383 5.0\n',
#  'AAACAAGGAACAAACGCACA 18.0 0.0 45.0 57.0 52.5552 10.0\n', 'AAAGGACACAGTGAGAGACG 9.0 0.0 52.0 59.0 48.662 0.0\n',
#  'CCACAACGCTCGAAGGCAAG 0.0 0.0 52.0 60.0 44.7269 10.0\n', 'AAGTACAGCGGGCCAAGATC 9.0 0.0 54.0 56.0 46.8607 5.0\n',
#  'CTCAGAAGATCTCGATGGCT 0.0 0.0 63.0 53.0 47.5395 0.0\n', 'AGCCATTGTCGAGTCCGTTA 0.0 0.0 63.0 52.0 48.4427 0.0\n',
#  'TGCCGCAAACTACACACACG 9.0 0.0 55.0 57.0 47.45 5.0\n']
for no in Num_log:
    # print(no[0])  # 字元形式的數字1,這是錯的，因為有可能序號超過一位數
    # Num_int.append(int(no.split("\n"))) ['1', '']
    Num_int.append(int(no.split("\n")[0]))
for Sum in Sum_log:
    # print(Sum.split("\n")[0].split(" ")[1:])
    # ['45.0', '0.0', '436.0', '364.0', '20.0']
    # ['27.0', '3.0', '398.0', '394.0', '25.0']
    # ['45.0', '0.0', '384.0', '394.0', '30.0']
    sum_eva_index = Sum.split("\n")[0].split(" ")[1:]
    sum_evaindex[0].append(float(sum_eva_index[0]))
    sum_evaindex[1].append(float(sum_eva_index[1]))
    sum_evaindex[2].append(float(sum_eva_index[2]))
    sum_evaindex[3].append(float(sum_eva_index[3]))
    sum_evaindex[4].append(float(sum_eva_index[4]))
print(sum_evaindex[0])  # [45.0, 27.0, 45.0]

python操作txt檔案中資料教程[2]-python提取txt檔案

python操作txt檔案中資料教程[2]-python提取txt檔案中的行列元素覺得有用的話,歡迎一起討論相互學習~Follow Me 原始txt檔案程式實現後結果-將txt中元素提取並儲存在csv中程式實現 import csv filename = "./test/te

python操作txt檔案中資料教程[3]-python讀取資料夾中所有txt檔案並將資料轉為csv檔案

python操作txt檔案中資料教程[3]-python讀取資料夾中所有txt檔案並將資料轉為csv檔案覺得有用的話,歡迎一起討論相互學習~Follow Me 參考文獻 python操作txt檔案中資料教程[1]-使用python讀寫txt檔案 python操作txt檔案中資料教程[2]-pyth

python操作txt檔案中資料教程[4]-python去掉txt檔案行尾換行

python操作txt檔案中資料教程[4]-python去掉txt檔案行尾換行覺得有用的話,歡迎一起討論相互學習~Follow Me 參考文章 python操作txt檔案中資料教程[1]-使用python讀寫txt檔案 python操作txt檔案中資料教程[2]-python提取txt檔案中的行列

python操作txt檔案中資料教程[1]-使用python讀寫txt檔案

python操作txt檔案中資料教程[1]-使用python讀寫txt檔案覺得有用的話,歡迎一起討論相互學習~Follow Me 原始txt檔案程式實現後結果程式實現 filename = './test/test.txt' contents = [] DNA_sequence

python中csv檔案中資料新增到MongoDB資料庫

使用csv中的DictReader函式讀取 #!/usr/bin/env python # -*- coding: utf-8 -*- # @Time : 2018/10/21 11:31 # @Author : deli Guo # @Site :

如何讀取pkl的檔案中資料並存入txt格式中

開啟.pkl檔案程式碼： import cPickle as pickle f = open('test.pkl') inf = pickle.load(f) print inf 再開啟一個txt檔案，向內寫入剛才讀取的資訊 ft = open('te

[雪峰磁針石部落格]python 3.7極速入門教程2 Hello與變數

Hello 命令列方式 $ python Python 3.7.0 (default, Jun 28 2018, 13:15:42) [GCC 7.2.0] :: Anaconda, Inc. on linux Type "help", "copyright", "credits" or "license

python檔案中呼叫另一個python檔案的類

如果是在同一個 module中(也就是同一個py 檔案裡),直接用就可以如果在不同的module裡,例如 a.py裡有 class A: b.py 裡有 class B: 如果你要在class B裡用class A 需要在 b.py的開頭寫上 from a import A

[Xcode10 實際操作]七、檔案與資料-(8 )讀取和解析Plist檔案(屬性列表檔案)

本文將演示如何讀取和解析Plist檔案，即屬性列表檔案。它是用來儲存，序列化後的物件的檔案。在專案名稱上點選滑鼠右鍵，彈出右鍵選單，選擇【New File】新建檔案命令，建立一份屬性列表檔案。在彈出的模板選項視窗中，點選右側的垂直滾動條，跳轉到【Resource】資原始檔的模板列表。然後選

grib中資料讀取並匯出到文字檔案中

最近忙著趕專案加上家裡的事比較多，就沒有來得及更新部落格，今天主要講解一下grib資料的檢視方法和讀取方法。grib資料沒有找到好的視覺化工具開啟它，官網提供的一個視覺化工具叫Metview，此工具的安裝過程相當的複雜，搞了將近3個小時最後還是沒有安裝成功，由於

python指令碼自動刪除空資料夾和非指定型別檔案(附贈批量重新命名)

python指令碼自動刪除空資料夾和非指定型別檔案直接上程式碼吧： # -*- coding: utf-8 -*- """ Created on Sun Sep 16 22:51:27 2018 @author: lele """ import

程式讀取配置檔案中資料顯示在頁面上

1.首先在配置檔案中增加要讀取的資料 cas.cmCustPayment.receiptInvoiceName=\u9996\u94A2\u667A\u65B0\u8FC1\u5B89\u7535\u78C1\u6750\u6599\u6709\u9650\u516C\u53F8 ca

【python】re模組的用法（2）—— 提取字串中括號內的內容

Python使用re模組正則提取字串中括號內的內容示例這篇文章主要介紹了Python使用re模組正則提取字串中括號內的內容,結合例項形式分析了Python使用re模組進行鍼對括號內容的正則匹配操作,並簡單解釋了相關修正符與正則語句的用法,需要的朋友可以參考下本文例項講述

[uEnv.txt]在uEnv.txt檔案中使用if語句實現Image/dtb檔案切換

指定image/dtb檔案 bootdir= bootfile=zImage fdtfile=embest-SBCC_PH8800_WLQ.dtb loadaddr=0x82000000 fdtaddr=0x88000000 finduuid=part uuid

UCloud釋出“資料方舟2.0” 強力防範檔案誤刪與勒索病毒攻擊

2017年1月14日某網際網路公司因發生故障導致資料損壞而重啟伺服器，並且由於相關備份資料庫也同時故障所以經多次嘗試最終仍舊無法修復成功。 2017年2月1日凌晨，著名的程式碼資源託管網站 Gitlab.com 的一位工程師在維護資料時不慎刪除約 300GB 的資料。當他意識到並按下 Ctrl +

python將mysql表中資料抽取到另一個mysql庫中，持續更新抽取到oracle中

import MySQLdb import ConfigParser class Mysql2Mysql(object): def getConn(self,filename,dbname): cf = ConfigParser.ConfigPars

SpringMVC 實現POI讀取Excle檔案中資料匯入資料庫（上傳）、匯出資料庫中資料到Excle檔案中（下載）

package com.shiliu.game.utils; import java.io.OutputStream; import java.net.URLEncoder; import java.util.ArrayList; import java.util.List; import

Hibernate配置檔案中資料型別date與timestamp區別

例如： <property name="createDate" type="timestamp" column="createDate"/> <property name="createDate" type="date" column="createDat

Java-讀取某個目錄下所有檔案、資料夾和3種從檔案路徑中獲取檔名的方法

1 讀取某個目錄下所有檔案、資料夾 public static ArrayList<String> getFiles(String path) { ArrayList<Str

使用C#將Excel檔案中資料匯入SQL Server資料庫

由於專案中加入了新的功能，可以使管理員向資料庫中匯入Excel資料。因此，在商品管理這塊需要對Excel進行操作，在網上查了些資料，根據專案的實際情況進行了一定的優化，這裡簡單的介紹下。 C#程式碼 /// <summary> /// 上傳Excel檔案，並將資

python操作txt檔案中資料教程[2]-python提取txt檔案

python操作txt檔案中資料教程[2]-python提取txt檔案中的行列元素

覺得有用的話,歡迎一起討論相互學習~Follow Me

程式實現

測試版本

相關推薦