Python-儲存物件&模型檔案

阿新 • • 發佈：2018-11-02

1. 儲存變數

1.1 pickle(泡菜)

pickle庫可以指定多個變數儲存在.pickle檔案中，如果需要儲存的變數不是很多，這種方法可以採用。

import pickle

# obj0, obj1, obj2 are created here...
obj0, obj1, obj2 = [1, 2], [2, 3], [3, 4]
# Saving the objects:
# 通過傳遞protocol = -1到dump()來減少檔案大小
with open('test.pickle', 'wb') as f:  # Python 3: open(..., 'wb') 

    pickle.dump([obj0, obj1, obj2], f)
f.close()

# Getting back the objects:
with open('test.pickle', 'rb') as f:  # Python 3: open(..., 'rb')
    x0, x1, x2 = pickle.load(f)
print(x0)
f.close()

[1, 2]

1.2 cPickle

cPickle的速度更快，其餘和cPickle基無差別。在python3裡面，cPickle變成_pickle。具體如下：

Docstring:   Optimized C implementation for the Python pickle module.

import  _pickle as cpickle

# obj0, obj1, obj2 are created here...
obj0, obj1, obj2 = [1, 2], [2, 3], [3, 4]
# Saving the objects:
# 通過傳遞protocol = -1到dump()來減少檔案大小
with open('test.pickle', 'wb') as f:  # Python 3: open(..., 'wb')
    cpickle.dump([obj0, obj1, obj2], f)
f.close()

del x0, x1, x2 
# Getting back the objects: 

with open('test.pickle', 'rb') as f:  # Python 3: open(..., 'rb')
    x0, x1, x2 = cpickle.load(f)
print(x0)
f.close()

[1, 2]

1.3 shelve

似乎不支援內建函式等其他的物件，也不是很智慧嘛～這樣到不如直接用pickle。參考：http://www.php.cn/python-tutorials-410803.html

import shelve

T='Hiya'
val=[1,2,3]

filename='test'
my_shelf = shelve.open(filename,'n') # 'n' for new

for key in dir():
    try:
        my_shelf[key] = globals()[key]
    except:
        #
        # __builtins__, my_shelf, and imported modules can not be shelved.
        #
        print('ERROR shelving: {0}'.format(key))
my_shelf.close()

del val,T

my_shelf = shelve.open(filename)
for key in my_shelf:
    globals()[key]=my_shelf[key]
my_shelf.close()

print(T)
# Hiya
print(val)
# [1, 2, 3]

1.4 dill

pycharm裡可以儲存檔案，but在jupyter裡報錯，不知道是個啥原因啊～

dump_session(filename='/tmp/session.pkl', main=None, byref=False)
    pickle the current state of __main__ to a file

import dill
# 儲存檔案
filename = 'globalsave.pkl'
dill.dump_session(filename)

dill.load_session(filename)

2. 儲存模型檔案

2.1 .model檔案

2.1.1 訓練模型

import pandas as pd
from sklearn.tree import DecisionTreeClassifier
from sklearn import cross_validation, metrics
from sklearn.datasets import load_iris
from sklearn.model_selection import train_test_split

# -- 載入鳶尾花資料集
iris_dataset = load_iris()
# -- 資料處理&訓練集、測試集切分
rawdata = pd.DataFrame(iris_dataset['data'], columns=['x0', 'x1', 'x2', 'x3'])
rawlabel = pd.DataFrame(iris_dataset['target'], columns=['label'])
dt_model = DecisionTreeClassifier()

train_X, test_X, train_y, test_y = train_test_split(rawdata,
                                                    rawlabel, test_size=0.3, random_state=0)
dt_model.fit(X=train_X, y=train_y)


print(metrics.classification_report(train_y,
                                    dt_model.predict(X=train_X)))

print(metrics.classification_report(test_y,
                                    dt_model.predict(X=test_X)))

2.1.2 儲存&呼叫模型檔案。

from sklearn.externals import joblib

# 模型儲存
joblib.dump(dt_model, './Code/dt_model.model')
# 模型載入
dt_model_load = joblib.load('./Code/dt_model.model')

print(metrics.classification_report(test_y,
                                    dt_model_load.predict(X=test_X)))

2.2 pickle檔案

發現pickle也可以用，不知道是否效能方面存在一定的問題～

import pickle
with open('dt_model.pickle', 'wb') as f:
    pickle.dump(dt_model, f)
f.close()

import pickle
with open('dt_model.pickle', 'rb') as f:  # Python 3: open(..., 'rb')
    x = pickle.load(f)

2.3 pmml檔案

sklearn訓練的模型可以儲存為pmml檔案，似乎可以用java直接呼叫～後面用到再說，其餘不贅。

2018-09-29 於南京紫東創業園

Python-儲存物件&模型檔案

1. 儲存變數 1.1 pickle(泡菜) pickle庫可以指定多個變數儲存在.pickle檔案中，如果需要儲存的變數不是很多，這種方法可以採用。 import pickle # obj0, obj1, obj2 are created here... obj0,

Python——儲存、讀取json檔案

python——儲存、讀取json檔案 file = open('test.json','w',encoding='utf-8') data1 = {'name':'john',"age":12} d

將python訓練好的模型儲存為pmml檔案供java呼叫

1、PMLL概述用python訓練好的機器學習模型如果上線部署，被java呼叫，可以將模型儲存為pmml檔案，那麼什麼是pmml呢？PMML是資料探勘的一種通用的規範，它用統一的XML格式來描述我們生成的機器學習模型。這樣無論你的模型是sklearn,R還是Sp

TensorFlow模型檔案儲存和讀取

一、模型檔案的儲存在訓練一個TensorFlow模型之後，我們可以將訓練好的模型儲存成檔案，這樣可以方便下一次對新的資料進行預測的時候直接載入訓練好的模型即可獲得結果，下面通過TensorFlow提供的tf.train.Saver函式，將一個模型儲存成檔案，一般習慣性的將TensorFlow的模

學習筆記-Python基礎19-結構化檔案儲存-json

# JSON- 線上工具 - w3c、菜鳥教程- JSON(JavaScriptObjectNotation)- 輕量級的資料交換格式，基於ECMAScript- json格式是一個鍵值對形式的資料集 - key:字串 - value:字串、數字、列表、json - json使用大括號

學習筆記-Python基礎19-結構化檔案儲存-正則

# 正則表示式(RegularExpression, re) - 是一個電腦科學的概念 - 用於使用單個字串來描述，匹配符合某個規則的字串 - 常常用來檢索、替換某些模式的文字# 正則寫法 - .(點號):表示任意一個字元,除了\n,比如查詢所有的一個字元 - []:匹配中括號中

Python 面向物件 - @classmethod & @staticmethod

@classmethod和@staticmethod很像，但他們的使用場景並不一樣。類內部普通的方法，都是以self作為第一個引數，代表著通過例項呼叫時，將例項的作用域傳入方法內； @classmethod以cls作為第一個引數，代表將類本身的作用域傳入。無論通過類來

python儲存身份證號碼為csv檔案顯示問題解決

用python處理含身份證號碼的文字檔案，將其另外儲存為csv檔案，該csv檔案使用wps開啟顯示身份證號碼後面三位數變為0，解決的辦法是：身份證號碼前加'\t'，例如下面程式碼： origine_file = r"C:\Files\名單.txt" save_to = "C:\Fil

用python批量獲取某路徑資料夾及子資料夾下的指定型別檔案，並按原資料夾結構批量儲存處理後的檔案

因為是把自己成功執行的整個程式碼按幾部分截取出來的，所以每一小節程式碼不一定能單獨執行，特此說明。 1.獲取某路徑資料夾及子資料夾下的指定pcm型別檔案的全部路徑 import os def eachfile(filepath): pathdi

python字串、列表和檔案物件總結

1、字串是字元序列。字串文字可以用單引號或者雙引號分隔。 2、可以用內建的序列操作來處理字串和列表：連線（+）、重複（*）、索引（[]），切片（[:]）和長度（len()）。可以用for迴圈遍歷字串的字元、列表中的項或檔案的行。 3、將數字資訊轉換為字串資訊的一種方式是用字串或者列表作為查詢表。 4、列

Python之物件的永久儲存模組---pickle

經常遇到在Python程式執行中得到了一些字串、列表、字典等資料，想要長久的儲存下來，方便以後使用，而不是簡單的放入記憶體中關機斷電就丟失資料。這個時候Pickle模組就派上用場了，它可以將物件轉換為一種可以傳輸或儲存的格式。　python的pickle模組實現了基本的資料序列和反序列化

python判斷小數示例&寫入檔案內容示例

#需求分析： #1、判斷小數點個數是否為1 #2、按照小數點分隔，取到小數點左邊和右邊的值 #3、判斷正小數，小數點左邊為整數，小數點右邊為整數 #4、判斷負小數，小數點左邊以負號開頭，並且只有一個負號，負號後面為整數，小數點右邊為整數 def is_float(s):

Python儲存類物件資料到資料夾

首先先介紹一種儲存字典，列表等基礎的Python型別進行儲存：儲存基礎資料 pickle是一個進行序列化的包，這裡，直接儲存一個具有3個字典，2個列表元素的列表！ with op

【python】儲存資料到JSON檔案

JSON簡介 JSON(JavaScript Object Notation, JS 物件簡譜) 是一種輕量級的資料交換格式。它基於 ECMAScript (歐洲計算機協會制定的js規範)的一個子集，採用完全獨立於程式語言的文字格式來儲存和表示資料。簡潔和清晰的層次結構使得

Python載入和解析包含多個JSON物件的JSON檔案

近期工作中，有一個爬蟲任務直接將文字內容存為了.json檔案，之後領導又給了個解析json檔案裡部分內容的需求，開始直接用with open開啟檔案用json.load讀取，然而因為一個檔案裡存在多個json物件，所以，失敗。網上相關操作資料貌似也並不多，在這裡

caffe使用均值檔案生成.npy檔案的Python程式碼,供後面模型測試使用

import sys,os caffe_root =’/home/hadoop/caffe/’ sys.path.append(’/home/hadoop/caffe/python’) import caffe os.chdir(caffe_root) impo

Python列表List儲存物件的指標

突然發現Python中列表(list)的一些有意思的設計： # coding:utf-8 a = [[1,2,3],[4,5,6],[7,8,9]] print 'a : ' print a b =

python儲存檔案

# 讀寫txt文字檔案 # 1.開啟檔案 # 使用python內建的open函式開啟txt檔案 # 1.要開啟的檔名稱 # mode 模式 # w 只能操作寫入 r 只能讀取 a向檔案追加 # w+ 可讀可寫 r+可讀可寫 a+ 可讀可寫 #

學習筆記——Python的物件模型

1、數字數字分為整型（int）如：1234， 564；浮點型（float）如：1.245， 3.1415926， 1.23e9， 1.2e-5；複數（complex）如：3+4j 2、字串（str）如：‘Lisa’， "I'm student"， "'Python'"； &n

python使用h5py讀取mat檔案資料，並儲存影象

1 安裝h5py sudo apt-get install libhdf5-dev sudo pip install h5py 假設你已經安裝好python和numpy模組 2 讀取mat檔案資

Python-儲存物件&模型檔案

1. 儲存變數

1.1 pickle(泡菜)

1.2 cPickle

1.3 shelve

1.4 dill

2. 儲存模型檔案

2.1 .model檔案

2.1.1 訓練模型

2.1.2 儲存&呼叫模型檔案。

2.2 pickle檔案

2.3 pmml檔案

相關推薦