python 3.6 生成器

阿新 • • 發佈：2022-06-05

最近在做bert文字分類，有一個生成器，記錄一下使用，跟我網上查到的不太一樣，主要在.iter()這個地方，很多程式碼都是沒有這個，不知道是不是版本原因

datalist, labellist = get_data_from_excel(r'data/test.xlsx')
data = data_generator(datalist).__iter__() # 注意這個.__iter__()
# 獲取一批資料
print(next(data))
# 或者
for x in data:
   print(x)

點選檢視程式碼

class data_generator:
    """
    data_generator只是一種為了節約記憶體的資料方式
    """
    def __init__(self, data, batch_size=Batch_size, shuffle=True):
        """
        :param data: 訓練的文字列表
        :param batch_size:  每次訓練的個數
        :param shuffle: 文字是否打亂
        """
        self.data = data
        self.batch_size = batch_size
        self.shuffle = shuffle
        self.steps = len(self.data) // self.batch_size
        if len(self.data) % self.batch_size != 0:
            self.steps += 1

    def __len__(self):
        return self.steps

    def __iter__(self):
        while True:
            idxs = list(range(len(self.data)))  # 生成一個序列
            if self.shuffle:
                np.random.shuffle(idxs)  # 打亂序列
            X1, X2, Y = [], [], []
            for i in idxs:
                d = self.data[i]
                text = d[0][:maxlen]
                x1, x2 = tokenizer.encode(first=text)  # 新增[CLS]和[SEP]
                y = d[1]
                X1.append(x1)
                X2.append(x2)
                Y.append([y])
                if len(X1) == self.batch_size or i == idxs[-1]:
                    # 對一批資料（最後一批不滿batch_size）進行padding
                    X1 = seq_padding(X1)  # 內部轉為了np.array
                    X2 = seq_padding(X2)
                    Y = seq_padding(Y)
                    yield [X1, X2], Y[:, 0, :]
                    [X1, X2, Y] = [], [], []

python 3.6 生成器

python 3.6 +pyMysql 操作mysql資料庫(例項講解)

版本資訊：python:3.6　　mysql:5.7　　pyMysql:0.7.11 #################################################################

Python 3.6打包成EXE可執行程式的實現

1、下載pyinstaller python 3.6 已經自己安裝了pip，所以只需要執行 pip install pyinstaller就可以了

Python 3.6 中使用pdfminer解析pdf檔案的實現

所使用python環境為最新的3.6版本一、安裝pdfminer模組安裝anaconda後，直接可以通過pip安裝

python 3.6.7實現埠掃描器

本文例項為大家分享了python 3.6.7埠掃描器的具體程式碼，供大家參考，具體內容如下

Python + Selenium -Python 3.6 3.7 安裝 PyKeyboard PyMouse

1.先安裝pyHook 進入其官網，搜尋pyHook找到該檔案: https://www.lfd.uci.edu/~gohlke/pythonlibs/#lxml

windows10上安裝mmdetection2.5.0 + pytorch1.6 + CUDA10.1 (python==3.6)

之前只能在windows上安裝py37版本的, 目前已支援py36了.(2020-10-19) 能不能安裝, 主要是看能裝什麼版本的mmcv-full. 在mmcv的安裝包網址上可以看到, 目前已經有mmcv_full-1.1.5+torch1.6.0+cu101-cp36-cp3

E: Failed to fetch http://ppa.launchpad.net/jonathonf/python-3.6/...

技術標籤：問題ubuntupython 在進行apt-get update時報瞭如下錯誤原因是因為無效的安裝源導致了403錯誤

python 3.6在linux16.04下的安裝命令列

技術標籤：pythonubuntu 安裝python3.6 sudo apt-get update sudo apt-get install python3.6 由於系統中存在多個python，因此如果要使用某個特定版本的python的話就要指定python版本，非常麻煩如果要使用pytho

ubuntu 20.04 安裝python 3.6.8

安裝依賴工具 sudo apt-get install -y gcc make build-essential libssl-dev zlib1g-dev libbz2-dev libreadline-dev libsqlite3-dev wget curl llvm libncurses5-dev libncursesw5-dev xz-utils tk-dev libffi-de

Bug "The PyDev.Debugger requires Python 3.6 onwards to be run" 解決

Bug The PyDev.Debugger requires Python 3.6 onwards to be run 解決 Traceback (most recent call last):

詳解python 降級到3.6終極解決方案

最近因為要安裝Tensorflow，然後發現tensorflow居然不支援python3.7，於是怒而將其降級到3.6

Python學習筆記之3.6-複數的數學運算》》》 complex(real, imag) 或 cmath模組

問題你寫的最新的網路認證方案程式碼遇到了一個難題，並且你唯一的解決辦法就是使用複數空間。再或者是你僅僅需要使用複數來執行一些計算操作。

CentOS release 6.9 下 Python 3.7.5 安裝記錄

CentOS 下安裝比較麻煩，需要基於原始碼安裝，所以在安裝之前還需要安裝很多依賴項，真的很多，先執行下面一個試試吧，不行再執行下面的，或者看缺少什麼就安裝什麼吧。

python-給一個引數n，例如３：先輸出1,2,3,4,5,6,7,8,9,每三個數後換行，後輸出1,4,7,2,5,8,3,6,9

\"\"\" 2 定義一個函式，fn(n)其中n表示輸入n行n列的矩陣，需要滿足的要求是在n為

已解決：Exception: Python in worker has different version 2.7 than that in driver 3.6

技術標籤：大資料pythonsparksparkhadooplinuxpython 已解決：Exception: Python in worker has different version 2.7 than that in driver 3.6, PySpark cannot run with different minor versions.Please che

resources.ap_不自動生成_Excel VBA函式篇-3.6自動錄入時間不精確？搭配時間生成器更完美...

技術標籤：resources.ap_不自動生成 Excel VBA之函式篇-3.6自動錄入時間不精確？搭配時間生成器更完美

Python 之控制QQ（9.5.8.28186）、微信（3.6.0.18）

Python 之控制QQ（9.5.8.28186）、微信（3.6.0.18）可能需要使用的庫,反正一大堆，部分程式碼裡有用到，部分是我自己用的

淺析 - CocoaLumberjack 3.6 之 DatabaseLogger

這是 DDLog 原始碼閱讀的最後一篇。本篇重點介紹 DDLogger 對資料庫儲存的支援，原理應該和 FileLogger 一樣，log 磁碟儲存的頻率，過期 log 的淘汰策略，以及 log 儲存的快取策略等。

原始碼淺析 - CocoaLumberjack 3.6 之 DDLog

介紹 CocoaLumberjack is a fast & simple,yet powerful & flexible logging framework for Mac and iOS.

python 3.6 生成器

相關推薦