dgl資料集的儲存和載入使用

阿新 • • 發佈：2020-12-30

技術標籤：dgl

DGL建議使用者實現儲存和載入資料的函式，將處理後的資料快取在本地磁碟中。這樣在多數情況下可以幫使用者節省大量的資料處理時間。DGL提供了4個函式讓任務變得簡單。

dgl.save_graphs()和dgl.load_graphs(): 儲存DGLGraph物件和標籤到本地磁碟和從本地磁碟讀取它們。
dgl.data.utils.save_info()和dgl.data.utils.load_info(): 將資料集的有用資訊(python dict物件)儲存到本地磁碟和從本地磁碟讀取它們。

下面的示例顯示瞭如何儲存和讀取圖和資料集資訊的列表。

import os
from dgl import save_graphs, load_graphs
from dgl.data.utils import makedirs, save_info, load_info

def save(self):
    # 儲存圖和標籤
    graph_path = os.path.join(self.save_path, self.mode + '_dgl_graph.bin')
    save_graphs(graph_path, self.graphs, {'labels': self.labels})
    # 在Python字典裡儲存其他資訊
    info_path = os.path.join(self.save_path, self.mode + '_info.pkl')
    save_info(info_path, {'num_classes': self.num_classes})

def load(self):
    # 從目錄 `self.save_path` 裡讀取處理過的資料
    graph_path = os.path.join(self.save_path, self.mode + '_dgl_graph.bin')
    self.graphs, label_dict = load_graphs(graph_path)
    self.labels = label_dict['labels']
    info_path = os.path.join(self.save_path, self.mode + '_info.pkl')
    self.num_classes = load_info(info_path)['num_classes']

def has_cache(self):
    # 檢查在 `self.save_path` 裡是否有處理過的資料檔案
    graph_path = os.path.join(self.save_path, self.mode + '_dgl_graph.bin')
    info_path = os.path.join(self.save_path, self.mode + '_info.pkl')
    return os.path.exists(graph_path) and os.path.exists(info_path)

請注意：有些情況下不適合儲存處理過的資料。例如，在內建資料集GDELTDataset中，處理過的資料比較大。所以這個時候，在__getitem__(idx)中處理每個資料例項是更高效的方法。

參考

https://docs.dgl.ai/guide_cn/data-savenload.html#guide-cn-data-pipeline-savenload

dgl資料集的儲存和載入使用

技術標籤：dgl DGL建議使用者實現儲存和載入資料的函式，將處理後的資料快取在本地磁碟中。這樣在多數情況下可以幫使用者節省大量的資料處理時間。DGL提供了4個函式讓任務變得簡單。

在Keras中實現儲存和載入權重及模型結構

1. 儲存和載入模型結構（1）儲存為JSON字串 json_string = model.to_json() （2）從JSON字串重構模型

keras訓練淺層卷積網路並儲存和載入模型例項

這裡我們使用keras定義簡單的神經網路全連線層訓練MNIST資料集和cifar10資料集：

在pytorch中儲存和載入神經網路

1. VGG簡介 VGG的名字源自於論文作者實驗室的名字Visual Geometry Group 。VGG提出了可以通過重複使用簡單的基礎塊來構建深度模型的思路。1

大資料的儲存和管理

大資料的儲存和管理任何機器都會有物理上的限制：記憶體容量、硬碟容量、處理器速度等等，我們需要在這些硬體的限制和效能之間做出取捨，比如記憶體的讀取速度比硬碟快得多，因此記憶體資料庫比硬碟資料庫

[NumPy]檔案的儲存和載入

import numpy as np 二進位制檔案 save()、savez()和load()函式以 numpy 專用的二進位制型別（npy、npz）儲存和讀取資料，這三個函式會自動處理ndim、dtype、shape等資訊，使用它們讀寫陣列非常方便，但是save()輸出

計分器（ViewModel、Databinding實現資料的儲存和控制元件操作）

Android中的ViewModel是一個可以用來儲存UI相關的資料的類。ViewModel的生命週期會比建立它的Activity、Fragment的生命週期長。

Python入門基礎篇 No.27 —— 列表_二維列表_表格資料的儲存和讀取

技術標籤：# 基礎列表python經驗分享程式人生windows Python入門基礎篇 No.27 —— 列表_二維列表_表格資料的儲存和讀取

pytorch儲存和載入模型的兩種方式

技術標籤：python """ pytorch的模型儲存和載入的兩種方式：方式1：只儲存和恢復模型中的引數，使用這種方法，我們需要自己匯入模型的結構資訊

TensorFlow模型儲存和載入方法彙總

技術標籤：tensorflow 目錄一、TensorFlow常規模型載入方法儲存模型載入模型1.不載入圖結構，只加載引數 2.載入圖結構和引數 3.簡化版本二、TensorFlow二進位制模型載入方法三、二進位制模型製作四、從圖上讀取

pytorch-模型儲存和載入

pytorch-模型儲存和載入目錄pytorch-模型儲存和載入儲存模型載入模型部分權重的載入案例

線性迴歸10-模型儲存和載入

1 sklearn模型的儲存和載入API from sklearn.externals import joblib 儲存：joblib.dump(estimator, \'test.pkl\')

PyTorch 介紹 | 儲存和載入模型

本節我們將會看到如何儲存模型狀態、載入和執行模型預測 import torch import torchvision.models as models

MatLab---基本繪圖功能(下)+資料的儲存和讀取(上)

一、grid on 與 grid off gird on 顯示網格 gird off 關閉網格顯示二、legend() 顯示圖示

Flink(三) Flink 程式設計模型之建立和載入資料集

Flink(三) Flink 程式設計模型之建立和載入資料集所有的 Flink 程式都是由三部分組成的： Source 、Transformation 和 Sink。

Pytorch使用MNIST資料集實現CGAN和生成指定的數字方式

CGAN的全拼是Conditional Generative Adversarial Networks，條件生成對抗網路，在初始GAN的基礎上增加了圖片的相應資訊。

Pytorch使用MNIST資料集實現基礎GAN和DCGAN詳解

原始生成對抗網路Generative Adversarial Networks GAN包含生成器Generator和判別器Discriminator，資料有真實資料groundtruth，還有需要網路生成的“fake”資料，目的是網路生成的fake資料可以“騙過”判別器，讓判

pytorch實現mnist資料集的影象視覺化及儲存

如何將pytorch中mnist資料集的影象視覺化及儲存匯出一些庫 import torch import torchvision

計算pytorch標準化(Normalize)所需要資料集的均值和方差例項

pytorch做標準化利用transforms.Normalize(mean_vals,std_vals)，其中常用資料集的均值方差有：

Pytorch自己載入單通道圖片用作資料集訓練的例項

pytorch 在torchvision包裡面有很多的的打包好的資料集，例如minist,Imagenet-12,CIFAR10 和CIFAR100。在torchvision的dataset包裡面，用的時候直接呼叫就行了。具體的呼叫格式可以去看文件（目前好像只有英文的）。

dgl資料集的儲存和載入使用

相關推薦