python讀取各種檔案資料解析

阿新 • • 發佈：2019-02-12

python讀取.txt（.log）檔案、.xml 檔案、excel檔案資料，並將資料型別轉換為需要的型別，新增到list中詳解

1.讀取文字檔案資料（.txt結尾的檔案）或日誌檔案（.log結尾的檔案）

以下是檔案中的內容，檔名為data.txt（與data.log內容相同），且處理方式相同，呼叫時改個名稱就可以了：

這裡寫圖片描述

以下是python實現程式碼：

# -*- coding:gb2312 -*-
import json
def read_txt_high(filename):
    with open(filename, 'r') as file_to_read:
        list0 = [] #檔案中的第一列資料 

        list1 = [] #檔案中的第二列資料
        while True:
            lines = file_to_read.readline()  # 整行讀取資料
            if not lines:
                break
            item = [i for i in lines.split()]
            data0 = json.loads(item[0])#每行第一個值
            data1 = json.loads(item[1])#每行第二個值
            list0.append(data0)
            list1.append(data1)
    return 
 list0,list1

list0與list1分別為文件中的第一列資料與第二列資料。執行若是文字檔案(.txt結尾的檔案)輸入以下：

aa,bb = read_txt_high('data.txt')
print aa
print bb

若是日誌檔案（.log結尾的檔案），輸入以下：

aa,bb = read_txt_high('data.log')
print aa
print bb

執行結果如下：

這裡寫圖片描述

2.讀取.xml結尾的檔案

XML檔案的名稱為abc.xml, 內容如下圖所示：

這裡寫圖片描述

以下是實現程式碼：

# -*- coding:gb2312 -*-
# coding = utf-8 

from pylab import *
import  xml.dom.minidom
def read_xml():
    dom = xml.dom.minidom.parse('abc.xml')#開啟xml文件
    cc=dom.getElementsByTagName('caption')
    list_str = [] #字串
    for item in cc:
        list_str.append(str(item.firstChild.data))

    bb = dom.getElementsByTagName('maxid')
    list_fig = []
    for item in bb:
        list_fig.append(item.firstChild.data)
    su = list_fig[0].encode("gbk")
    list_fig2 = su.split(",")
    list_fig_num = []
    for i in list_fig2:
        list_fig_num.append(int(i))

    ee = dom.getElementsByTagName('time')
    list_tim = []
    for item in ee:
        list_tim.append(item.firstChild.data)
    sg = list_tim[0].encode("gbk")
    list_time = sg.split(",")

    gg = dom.getElementsByTagName('font_size')
    g1 = []
    for item in gg:
        g1.append(item.firstChild.data)
    su = g1[0].encode("gbk")
    return list_str,list_fig_num,list_time,su

呼叫此函式如下所示：

a,b,c,d = read_xml()
print a
print b
print c
print d

輸出結果如下圖所示：

這裡寫圖片描述

3.讀取excel檔案資料，並將其存入list列表中

excel表格中的資料如下圖所示，表格命名為data.xlsx：

這裡寫圖片描述

首先將ID列中的資料儲存到列表list_col中，實現程式碼如下所示：

# -*- coding: utf-8 -*-
import xlrd
import json

def read_ex_stop_PTline():
    # 開啟檔案
    workbook = xlrd.open_workbook(r'data.xlsx')
    sheet = workbook.sheet_by_name('PTline')
    list_col = []
    for i in range(1,sheet.nrows):
        c = sheet.cell(i,3).value
        list_col.append(int(c))
    print list_col

呼叫此函式，輸出結果如下：

這裡寫圖片描述

以下將linkIDsequence列資料存放到一個list中，即list_ele中，實現程式碼如下：

# -*- coding: utf-8 -*-
import xlrd
import json

def read_ex_stop_PTline():
    # 開啟檔案
    workbook = xlrd.open_workbook(r'data.xlsx')
    sheet = workbook.sheet_by_name('PTline')
    list_ele = [] #第八列的所有資料放入一個list中
    for i in range(1,sheet.nrows):
        c = sheet.cell(i, 8).value
        cc = json.loads(c) #第八列的每個單元格處理為一個list
        for j in range(len(cc)):
            list_ele.append(cc[j])
    print list_ele

呼叫函式read_ex_stop_PTline，輸出結果如下圖所示：

這裡寫圖片描述

python讀取各種檔案資料解析

python讀取.txt（.log）檔案、.xml 檔案、excel檔案資料，並將資料型別轉換為需要的型別，新增到list中詳解 1.讀取文字檔案資料（.txt結尾的檔案）或日誌檔案（.log結尾的檔案）以下是檔案中的內容，檔名為data.txt（與d

python讀取.txt檔案資料和將資料寫入檔案.txt

一.讀取.txt檔案中的資料到張量中說明：將data_x.txt和data_y.txt中的資料分別讀取到x_data張量中 #!/usr/bin/python # coding=utf-8 im

使用python讀取excel檔案資料

# -*- coding : UTF-8 -*- import xlrd class OpenExl(): #初始化exl檔案，by_index表示第幾個工作表單，預設值為0。 def __init__(self, exc_file, by_index = 0): # 開啟檔

python讀取yaml檔案中的資料

注意：在python2中進行讀取方式有兩種程式碼中的其中一種方式以註釋的形式展現出來： yaml中檔案的內容如下： 'top寬度:': '27' # ----------- 必須 ----------------------- # 計算機使用者名稱 username: onepoi

使用python來讀取超大型檔案資料

在實際應用中，幾乎所有的資料分析工作都是從資料讀取開始的，如果資料量太大導致資料檔案讀取失敗了，這樣後續的工作就沒有辦法進行了，在機器自身硬體記憶體限制的情況下，當檔案量過大的時候直接使用read等函式來進行操作的時候就會報錯，這裡就需要採取一定的策略來儘可能地避免這樣的

Python使用pandas讀取Excel檔案資料和預處理小案例

假設有Excel檔案data.xlsx，其中內容為現在需要將這個Excel檔案中的資料讀入pandas，並且在後續的處理中不關心ID列，還需要把sex列的female替換為1，把sex列的male替換為0。本文演示有關的幾個操作。（1）匯入pandas模組 >>> import p

使用python pandas讀取csv檔案資料

csv是我接觸的比較早的一種檔案，比較好的是這種檔案既能夠以電子表格的形式檢視又能夠以文字的形式檢視。最早接觸是在別人的Perl指令碼中，或許是為了充分利用Perl的文字處理能力。不過，日常的生活工作

python使用h5py讀取mat檔案資料，並儲存影象

1 安裝h5py sudo apt-get install libhdf5-dev sudo pip install h5py 假設你已經安裝好python和numpy模組 2 讀取mat檔案資

讀書筆記--python資料視覺化--001_讀取CSV檔案資料

#-*- coding: UTF-8 -*- ''' ################################################# # Author : 餘歡 # Date : Dec 26, 2015 2:25:39 PM

python讀取json檔案，並將資料插入到mongodb

#coding=utf-8 import sunburnt import urllib from pymongo import Connection from bson.objectid import ObjectId import logging from dateti

python的讀取csv檔案資料

1.基本的讀取檔案的方式 import csv csv_reader=csv.reader(open('taxi.csv',encoding='utf-8')) for row in csv_re

python:讀取文字檔案的行資料,檔案.splitlines()

一般跟蹤訓練的ground_truth的資料儲存在文字文檔案中,故每一行的資料為一張圖片的標籤資料,這個時候讀取每一張圖片的標籤,具體實現如下: test_txt = '/home/zcm/ten

資料集生成方法：Python讀取txt檔案中的URL路徑並下載圖片

1.資料來源：可針對自己的模型需要在imagenet官網上下載所需類別對應的txt檔案。 2.資料下載： import os from urllib.request import urlretrieve def download(): catego

python讀取大檔案的方法 python計算檔案的行數和讀取某一行內容的實現方法

python計算檔案的行數和讀取某一行內容的實現方法：最簡單的辦法是把檔案讀入一個大的列表中,然後統計列表的長度.如果檔案的路徑是以引數的形式filepath傳遞的,那麼只用一行程式碼就可以完成我們的需求了: 1、http://blog.csdn.net/shudaq

android讀取csv檔案資料

csv檔案是一種表格形式的檔案，如果把檔案字尾名改為.txt，會發現同一行資料之間是用英文“,”隔開的。如何讀取csv檔案以便把資料存入資料庫呢，特別是csv檔案中有些資料是空？ csv檔案如下：把檔案字尾名改為.txt後如下：電錶id,電錶編號,模組地址,描述,所屬站點名稱,

TensorFlow讀取二進位制檔案資料到佇列

TensorFlow是一種符號程式設計框架（與theano類似），先構建資料流圖再輸入資料進行模型訓練。Tensorflow支援很多種樣例輸入的方式。最容易的是使用placeholder，但這需要手動傳遞numpy.array型別的資料。第二

WAV檔案資料解析（4.10更新一點小程式碼）

作為一個初級的演算法和聲紋的工程師，寫個blog記錄一下自己近期所接觸的知識點，作為日後參考和複習用首先都是文字，後期有空再加圖片和改格式，很多內容都是通過被人的blog參考和整理得來。日後慢慢的更新聲紋識別SRE的演算法以及機器學習的演算法和資料分析的實踐更新：最近專案測了個模型，

python讀取.caffemodel檔案

想讀取預訓練好的.caffemodel檔案的資訊，瞭解模型引數和結構 import caffe.proto.caffe_pb2 as caffe_pb2 caffemodel_filename = 'resnet101_faster_rcnn_final.caffemodel' model =

Python讀取scel檔案

背景介紹：將搜狗詞庫中 .scel 檔案轉化為 .txt 檔案搜狗詞庫連結：https://pinyin.sogou.com/dict/ 搜狗的scel詞庫就是儲存的文字的unicode編碼，每兩個位元組一個字元（中文漢字或者英文字母）找出其每部分的偏移位置即可，主要兩部分：

python讀取xls檔案

#!/usr/bin/env python # -*- coding: utf-8 -*- # @Time : 2018/10/17 14:41 # @Author : Sa.Song # @Desc : # @File : read_xls.py # @Software: PyC

python讀取各種檔案資料解析

python讀取.txt（.log）檔案 、.xml 檔案 、excel檔案資料，並將資料型別轉換為需要的型別，新增到list中詳解

1.讀取文字檔案資料（.txt結尾的檔案）或日誌檔案（.log結尾的檔案）

2.讀取.xml結尾的檔案

3.讀取excel檔案資料，並將其存入list列表中

相關推薦

python讀取.txt（.log）檔案、.xml 檔案、excel檔案資料，並將資料型別轉換為需要的型別，新增到list中詳解