tensorflow--從檔案讀取資料

阿新 • • 發佈：2018-11-03

讀取資料-csv

tensorflow讀取資料流程

構造檔案佇列
讀取佇列內容 reader = tf.TextLineReader()
解析成一個樣本資料 example, label = tf.decode_csv(value, record_defaults=records)
批處理
主執行緒取樣本

def csvread(filelist):
    """
    讀取CSV檔案
    :param filelist: 檔案路徑+名字的列表
    :return: 讀取的內容
    """
    # 1、構造檔案的佇列 

    # 此操作會隱含地將一個QuenuRunner加入全域性圖中
    file_queue = tf.train.string_input_producer(filelist)

    # 2、構造csv閱讀器讀取佇列資料（按一行）（key檔名，value讀取的內容）
    reader = tf.TextLineReader()
    key, value = reader.read(file_queue)

    # 3、對每行內容解碼,example, label是指我讀取的資料的兩個特徵
    # record_defaults:指定每一個樣本的每一列的型別，指定預設值[["None"], [4.0]] 

    records = [["None"], ["None"]]
    example, label = tf.decode_csv(value, record_defaults=records)

    # 4、想要讀取多個數據，就需要批處理
    example_batch, label_batch = tf.train.batch([example, label], batch_size=9, num_threads=1, capacity=9)

    return example_batch, label_batch

主執行緒呼叫：

# 找到指定資料夾下的所有檔案,將路徑+名字存到列表中 

file_name = os.listdir("資料夾路徑")
filelist = [os.path.join("資料夾路徑", file) for file in file_name]
# 呼叫函式讀取資料
example, label = csvread(filelist)
# 會話
with tf.Session() as sess:  
    # 執行緒協調器
    coord = tf.train.Coordinator()
    # 開啟讀檔案的執行緒
    threads = tf.train.start_queue_runners(sess,coord=coord)
    # 打印出來
    print(sess.run([example, label]))    
    #回收子執行緒
    coord.request_stop()
    coord.join(threads)

讀取資料-圖片

tensorflow讀取資料流程

構造檔案佇列
讀取佇列內容 tf.WholeFileReader()
解析成一個樣本資料 image = tf.image.decode_jpeg(value)
批處理
主執行緒取樣本

def read_pic(file_list):
    # 檔案佇列
    file_queue = tf.train.string_input_producer(file_list)
    # 讀資料
    reader = tf.WholeFileReader()
    key, value = reader.read(file_queue)
    # 解碼
    image = tf.image.decode_jpeg(value)
    # 統一圖片大小
    image_resize = tf.image.resize_images(image, [300, 200])
    # 批處理需要，必須指定通道數
    image_resize.set_shape([300,200,3])
    # 批處理
    image_batch = tf.train.batch([image_resize], batch_size=5)

    return image_batch

主執行緒呼叫：

# 找到指定資料夾下的所有檔案,將路徑+名字存到列表中
file_name = os.listdir("資料夾路徑")
filelist = [os.path.join("資料夾路徑", file) for file in file_name]
# 呼叫函式讀取資料
image = read_pic(file_list)

with tf.Session() as sess:
    coord = tf.train.Coordinator()
    threads = tf.train.start_queue_runners(sess, coord=coord)
   
    print(sess.run(image))

    coord.request_stop()
    coord.join(threads)

讀取資料-二進位制

tensorflow讀取資料流程

構造檔案佇列
讀取佇列內容 reader = tf.FixedLengthRecordReader(位元組數)
解析成一個樣本資料 content = tf.decode_raw(value, tf.uint8)
批處理
主執行緒取樣本

def bin_reader(filelist):
    """
    讀取CSV檔案
    :param filelist: 檔案路徑+名字的列表
    :return: 讀取的內容
    """
    # 1、構造檔案的佇列
    # 此操作會隱含地將一個QuenuRunner加入全域性圖中
    file_queue = tf.train.string_input_producer(filelist)

    # 2、構造csv閱讀器讀取佇列資料（按一行）（key檔名，value讀取的內容）
    reader = tf.FixedLengthRecordReader(位元組數)
    key, value = reader.read(file_queue)

    # 3、對每行內容解碼,需要指定讀取內容的型別
    content = tf.decode_raw(value, tf.uint8)

    # 4、想要讀取多個數據，就需要批處理
    content_batch = tf.train.batch([contentl], batch_size=9, num_threads=1, capacity=9)

    return example_batch, label_batch

主執行緒呼叫：

# 找到指定資料夾下的所有檔案,將路徑+名字存到列表中
file_name = os.listdir("資料夾路徑")
filelist = [os.path.join("資料夾路徑", file) for file in file_name]
# 呼叫函式讀取資料
content = bin_reader(filelist)
# 會話
with tf.Session() as sess:  
    # 執行緒協調器
    coord = tf.train.Coordinator()
    # 開啟讀檔案的執行緒
    threads = tf.train.start_queue_runners(sess,coord=coord)
    # 打印出來
    print(sess.run([contentl]))    
    #回收子執行緒
    coord.request_stop()
    coord.join(threads)

tensorflow--從檔案讀取資料

讀取資料-csv tensorflow讀取資料流程構造檔案佇列讀取佇列內容 reader = tf.TextLineReader() 解析成一個樣本資料 example, label = tf.decode_csv(value, record_defaults

spark部分json從檔案讀取資料【java純程式碼】

package com.bjsxt; import org.apache.hadoop.hdfs.server.namenode.dfsclusterhealth_jsp; import org.apache.spark.SparkConf; import org.apac

從.resx檔案讀取資料

//.resx檔案讀取，檔案為內容 private string languageResx(string language, string key) { string filename; switch (la

從PCD檔案讀取資料

首先寫c++檔案 #include <iostream> #include <pcl/io/pcd_io.h> #include <pcl/point_types.h>

Android Studio平臺下使用hellochart實現從txt檔案讀取資料繪折線圖

Android Studio平臺下使用hellochart實現從文字讀取資料繪折線圖本人是一個剛剛接觸Android不超過兩個月的小白，最近在做的論文是關於這一塊的相關內容。所有的東西都是自學的，聽導師的建議也是第一次留個這樣的資料，可能有很多地方理解不到位，

springboot~openfeign從JSON檔案讀取資料

對於openfeign來說，幫助我們解決了服務端呼叫服務端的問題，你不需要關心服務端的URI，只需要知道它在eureka裡的服務名稱即可，同時你與服務端確定了服務方法的引數和返回值之後，我們可以在單元測試時mock這些服務端方法即可，真正做到了單元測試，而不需要與外界資源進行互動。今天主要說一下在op

flume從本地讀取資料錄入到hdfs檔案系統

配置檔案 agent.sources = origin agent.channels = memorychannel agent.sinks = target agent.sources.origin.type = TAILDIR agent.source

C/C++從文字檔案讀取資料

本文主要是利用C函式fread、fwrite、fscanf以及C++檔案流ifstream、ofstream等函式從檔案讀寫。 #include <stdio.h> #include <stdlib.h> #include <iostr

python-從檔案讀取json資料寫到資料庫

#!/bin/env python #coding=utf-8 import sys import urllib2 import json import datetime import pymysql as MySQLdb import time from itert

TensorFLow 讀取圖片1：初探四種從檔案讀取的方式

本文記錄一下TensorFLow的幾種圖片讀取方法，官方文件有較為全面的介紹。 1.使用gfile讀圖片，decode輸出是Tensor，eval後是ndarray import matplotlib.pyplot as plt import tensorf

jQueryAjax++servlet+json實現頁面載入時從後臺讀取資料

在eclipse中新建一個專案，我起名為Demo 新建一個html檔案，在其中引入外部jQuery和自定義的js檔案 <!DOCTYPE html> <html> <head> <meta charset="UTF-8"> <sc

python從檔案讀取URL，導致爬蟲失敗

需求：從檔案中逐行讀取md5字串，作為URL引數抓取某個介面返回的內容，並儲存到資料庫。問題：介面返回請求引數錯誤，經過對比發現直接在URL中寫死MD5引數就沒問題，資料正常返回。解決過程： 1.首先排除了從檔案中讀取的字串，和直接寫的字串編碼不同的問題。 2.後面想到tx

基於前端框架react或者vue或者其他其他框架到出資料生成csv檔案,以及匯入csv檔案讀取資料的簡單例子

1.用npm在專案中安裝以下外掛: npm install file-saver --save npm install papaparse --save npm install jschardet --save npm install iconv-lite --save npm install

Kafka——Kafka消費者（從Kafka讀取資料）

KafkaConsumer概念消費者和消費者群組假設我們有一個應用程式需要從一個Kafka 主題讀取訊息並驗證這些訊息，然後再把它們儲存起來。應用程式需要建立一個消費者物件，訂閱主題並開始接收訊息，然後驗證訊息井儲存結果。過了一陣子，生產者往主題寫入訊息的速度超過了應用程式驗證資料的

spark從mysql讀取資料（redis/mongdb/hbase等類似，換成各自RDD即可）

package com.ws.jdbc import java.sql.DriverManager import org.apache.spark.rdd.JdbcRDD import org.apache.spark.{SparkConf, SparkCont

pytorch學習筆記(2)-使用自定義txt檔案讀取資料

import os import torch from PIL import Image from torch.utils.data import Dataset from torchvision import datasets, models, transfo

Spark---WC---Spark從外部讀取資料之textFile

測試資料 hello spark hello hadoop csdn hadoop csdn csdn hello world 結果 (spark,1) (hadoop,2) (csdn,3) (hello,3) (world,1) import org.

pandas從excel讀取資料處理的注意事項

##excel中支援的資料型別較pandas多的多因為從excel讀取的資料型別很多預設是object，資料處理前建議轉換成str等。pandas中當多列同為object時，實際資料不相同。如merge時 ggg=pd.merge(cs,c,how="inner",lef

Kafka消費者——從 Kafka讀取資料

應用程式使用 KafkaConsumer向 Kafka 訂閱主題，並從訂閱的主題上接收訊息。從 Kafka 讀取資料不同於從其他悄息系統讀取資料，它涉及一些獨特的概念和想法。如果不先理解這些概念，就難以理解如何使用消費者 API。所以我們接下來先解釋這些重要的概念，然

Java呼叫R ，從資料庫讀取資料，用R根據讀取的資料生成圖片儲存

Java呼叫R 以及用R生成的圖片儲存使用 png()可以保證圖片質量有人說繪製的圖片上有中文會出現亂碼，其實設定下字型就好了 family=‘STXihei’ Java呼叫R 以及用R生成的圖片儲存 Rserve的配置和啟動： ①安裝Rserve包。

tensorflow--從檔案讀取資料

讀取資料-csv

讀取資料-圖片

讀取資料-二進位制

相關推薦