機器學習-分類2

阿新 • • 發佈：2018-12-17

今天，在分類模型上又添加了如下程式碼。

#單個預測，對輸出的類別進行排序
Class = list(pipe.classes_)
print(Class)
X=['感冒 咳嗽 噁心 頭暈 頭痛']
Pipe = pipe.predict(X)
print(Pipe)
prob = pipe.predict_proba(X)
Prob = sum(prob.tolist(),[])
dict1=dict(zip(Class,Prob))
SORT=sorted(dict1.items(), key=lambda e:e[1], reverse=True)
test1={}
test1[Pipe[0]]=SORT
print(test1)

輸出結果如下

['免疫系統', '內分泌系統', '呼吸系統', '泌尿系統', '消化系統', '淋巴系統', '生殖系統', '面板系統', '神經系統', '肌肉系統', '血液血管', '骨骼系統']
['呼吸系統']
{'呼吸系統': [('呼吸系統', 0.4076064809555076), ('消化系統', 0.12141905116600904), ('骨骼系統', 0.059634970594289), ('神經系統', 0.05574679784390724), ('血液血管', 0.05548952693913911), ('面板系統', 0.05461155325220834), ('免疫系統', 0.05206000062171274), ('肌肉系統', 0.049025147795265955), ('生殖系統', 0.04393882033284857), ('泌尿系統', 0.03716749480813982), ('淋巴系統', 0.034065064514598876), ('內分泌系統', 0.029235091176373674)]}

#對沒有label的檔案進行預測，對預測結果進行排序後輸出json格式檔案
import json
f=open('test_to_predict.txt','r',encoding='utf-8')
test ={}
for i in f:
    i=i.strip('\n')
    Pipe = pipe.predict([i])
#     print(Pipe)
    prob = pipe.predict_proba([i])
    Prob = sum(prob.tolist(),[])
    dict2=dict(zip(Class,Prob))#將2個list整合成dict，也可以整合成tuple
    Sort = sorted(dict2.items(), key=lambda e:e[1], reverse=True)
#     print(Sort)
    test[Pipe[0]]=Sort
print(test)
# print(json.dumps(test,ensure_ascii=False))
with open('predict_result.json','w',encoding='utf-8') as f:
    f.write(json.dumps(test,ensure_ascii=False))

#計算預測的資料集的準確率。predict_text是已經標好了label的資料，用Tab鍵隔開
f=open('predict_text.txt','r',encoding='utf-8')
total_num=0
corr_num=0
for i in f:   
    i = i.encode('utf-8').decode('utf-8-sig').strip('\n').split('\t')#防止讀入txt出現\ufeff的問題
    Pipe = pipe.predict([i[1]])
#     print(Pipe)
#     print([i[0]])
    if [i[0]]==Pipe:
        corr_num += 1
    total_num +=1
# print(corr_num)
print(corr_num/total_num)

機器學習-分類2

今天，在分類模型上又添加了如下程式碼。 #單個預測，對輸出的類別進行排序 Class = list(pipe.classes_) print(Class) X=['感冒咳嗽噁心頭暈頭痛'] Pipe = pipe.predict(X) print(Pip

機器學習分類

思想多次大數它的發揮範圍預測可能特征值目前，機器學習的方法主要有三種：監督學習、半監督學習和無監督學習。監督學習是利用一組已知類別的樣本調整分類器的參數，使其達到所要求性能的過程。白話一點，就是根據已知的，推斷未知的。代表方法有：Nave Bayes、SV

機器學習分類實例——SVM(修改)/Decision Tree/Naive Bayes

nature console 內容 sign dal 一次 .html not cat 機器學習分類實例——SVM(修改)/Decision Tree/Naive Bayes 20180427-28筆記、30總結已經5月了，畢設告一段落了，該準備論文了。前天開會老師說

機器學習（2） - KNN識別MNIST

min lose fse skip show turn ESS 行數 sna 代碼 https://github.com/s055523/MNISTTensorFlowSharp 數據的獲得數據可以由http://yann.lecun.com/exdb/mnist

吳恩達機器學習筆記2-監督學習

word ins problems 一個 should regress ssi pri read 英文; Supervised Learning 　　In supervised learning, we are given a data set and already kn

【機器學習】機器學習分類器模型評價指標機器學習分類器模型評價指標

機器學習分類器模型評價指標分類器評價指標主要有： 1，Accuracy 2，Precision 3，Recall 4，F1 score 5，ROC 曲線

Scikit-learn在Python中構建機器學習分類器

機器學習是電腦科學、人工智慧和統計學的研究領域。機器學習的重點是訓練演算法以學習模式並根據資料進行預測。機器學習特別有價值，因為它讓我們可以使用計算機來自動化決策過程。在本教程中，您將使用Scikit-learn（Python的機器學習工具）在Python中實現一個簡單的機器學習演算法。您將使用Naive

機器學習 -- 分類

1. 樸素貝葉斯貝葉斯決策理論方法是統計模型決策中的一個基本方法，基本思想如下：（1）已知類條件概率密度引數表示式和先驗概率（2）利用貝葉斯公式轉換成後驗概率（3）根據後驗概率大小進行決策分類。

機器學習分類器---決策樹

一、決策樹經常使用決策樹來處理分類問題，決策樹也是最經常使用的資料探勘演算法，不需要了解機器學習的知識，就能搞明白決策樹是如何工作的。 kNN演算法可以完成很多分類任務，但它最大的缺點就是無法給出資料的內在含義，決策樹的主要優勢在於資料形式非常容易理解決策樹能夠讀取資

機器學習概覽2

-什麼是機器學習？機器學習就是一段可以從經驗中學習計算機程式，關於一些任務T和以及程式在任務T中的表現的效能評估P，程式能隨著經驗不斷的提升效能。 -更多關於機器學習的定義機器學習是一門讓計算機在不被明確程式設計的情況下行動的科學。---吳恩達機器學習是

《機器學習實戰2》

2017.2.28 第二章《k-近鄰演算法》思維導圖： 1、基本演算法原理簡單地說，k近鄰演算法採用測量不同特徵值之間的距離方法進行分類。優點：精度高、對異常值不敏感、無資料輸入假定。缺點：計算複雜度高、空間複雜度高。適用資料範圍：數值型和標稱型。工作原理：存在

【python和機器學習入門2】決策樹3——使用決策樹預測隱形眼鏡型別

參考部落格：決策樹實戰篇之為自己配個隱形眼鏡（po主Jack-Cui,《——大部分內容轉載自參考書籍：《機器學習實戰》——第三章3.4

【python和機器學習入門2】決策樹2——決策樹構建

參考部落格：決策樹實戰篇之為自己配個隱形眼鏡（po主Jack-Cui,《——大部分內容轉載自參考書籍：《機器學習實戰》——第三章

一份非常全面的機器學習分類與迴歸演算法的評估指標彙總

本文是《機器學習寶典》第 3 篇，讀完本文你能夠掌握分類與迴歸演算法的評估指標。 PS：文末附有練習題讀完機器學習演算法常識之後，你已經知道了什麼是欠擬合和過擬合、偏差和方差以及貝葉斯誤差。在這篇給大家介紹一些機器學習中離線評估模型效能的一些指標。當我們訓練得到

機器學習分類演算法之K近鄰（K-Nearest Neighbor）

一、概念 KNN主要用來解決分類問題，是監督分類演算法，它通過判斷最近K個點的類別來決定自身類別，所以K值對結果影響很大，雖然它實現比較簡單，但在目標資料集比例分配不平衡時，會造成結果的不準確。而且KNN對資源開銷較大。二、計算通過K近鄰進行計算，需要： 1、載入打標好的資料集，然

機器學習分類演算法常用評價指標

# -*- coding: utf-8 -*- import pandas as pd from sklearn.ensemble import RandomForestClassifier from sklearn import metrics import matplotlib.pyplot as p

深入理解Java虛擬機器學習筆記2-JVM中物件佈局

一、物件的記憶體佈局在Hotspot中，物件在記憶體中儲存佈局可以分為三塊：物件頭（Header）、例項資料（Instance Data）、對齊填充（Padding）二、物件頭 1、物件執行時資料：雜湊嗎、GC分代年齡、鎖狀態標誌、執行緒持有的鎖、偏向執行緒I

機器學習實戰2——Tensorflow初使用

Tensorflow的一些亮點： 1.可以執行在windows,Linux,macOS和移動裝置上 2.提供了TF .Learn的API來相容Scikit-Learn 3.提供了TF-Slim的API來簡化神經網路的構建、訓練和評估 4.在Tensorflow之上，獨

吳恩達機器學習練習2——正則化的Logistic迴歸

機器學習練習2——正則化的Logistic迴歸過擬合如果我們有非常多的特徵，我們通過學習得到的假設可能能夠非常好地適應訓練集（代價函式可能幾乎為0），但是可能會不能推廣到新的資料。解決： 1.丟棄一些不能幫助我們正確預測的特徵。可以是手工選擇保留哪些特

吳恩達機器學習練習2——Logistic迴歸

Logistic迴歸代價函式 Logistic迴歸是分類演算法，它的輸出值在0和1之間。 h(x)的作用是，對於給定的輸入變數，根據選擇的引數計算輸出變數等於1的可能性（estimated probablity）即h(x)=P(y=1|x;

機器學習-分類2

相關推薦