機器學習-實戰-入門-linearSVC和SVC,身高體重與胖瘦關係的分類與預測

阿新 • • 發佈：2019-01-24

#對資料集進行預處理
import random

def calc_bmi(h, w):
    bmi = w / (h/100) ** 2
    if bmi < 18.5: return "thin"
    if bmi < 25.0: return "normal"
    return "fat"
#bim值小於18.5是瘦，小於25.0是普通，否側是胖

fp = open("./data/bmi.csv","w",encoding="utf-8")
fp.write("height,weight,label\r\n")

cnt = {"thin":0, "normal":0, "fat":0}
for i in range(20000):
    h = random.randint(120,200)
    w = random.randint(35, 80)
    label = calc_bmi(h, w)
    cnt[label] += 1
    fp.write("{0},{1},{2}\r\n".format(h, w, label))
fp.close()
print("ok,", cnt)

二.資料資訊視覺化繪圖

#繪製三種不同型別的資料分佈
import matplotlib.pyplot as plt
import pandas as pd

tbl = pd.read_csv("./data/bmi.csv", index_col=2)
#讀取資料

fig = plt.figure()
ax = fig.add_subplot(1, 1, 1)
#三種子圖重疊

def scatter(lbl, color):
    b = tbl.loc[lbl]
    ax.scatter(b["weight"],b["height"], c=color, label=lbl)

scatter("fat",    "red")
scatter("normal", "yellow")
scatter("thin",   "purple")
#設定不同屬性顏色

ax.legend() 
plt.show()
#顯示影象

執行結果

三.運用sklearn中的SVM的SVC訓練資料並預測結果

#用sklearn的SVC方法來訓練資料集，並交叉驗證預測精度
from sklearn import cross_validation, svm, metrics
import matplotlib.pyplot as plt
import pandas as pd

tbl = pd.read_csv("./data/bmi.csv")
#讀取資料

label = tbl["label"]
#讀取資料中的標籤列
w = tbl["weight"] / 100 
h = tbl["height"] / 200 
wh = pd.concat([w, h], axis=1)

data_train, data_test, label_train, label_test = cross_validation.train_test_split(wh, label)
#將資料分成兩組資料集和測試集

clf = svm.SVC()
clf.fit(data_train, label_train)
#訓練資料

predict = clf.predict(data_test)
#預測資料

ac_score = metrics.accuracy_score(label_test, predict)
#生成測試精度
cl_report = metrics.classification_report(label_test, predict)
#生成交叉驗證的報告
print(ac_score)
#顯示資料精度
print(cl_report)
#顯示交叉驗證資料集報告

執行結果

交叉驗證三組測試集平均預測精度為0.99 四.運用sklearn中的SVM的linearSVC訓練資料並預測結果

#用sklearn的LinearSVC方法來訓練資料集，並交叉驗證預測精度
from sklearn import cross_validation, svm, metrics
import matplotlib.pyplot as plt
import pandas as pd

tbl = pd.read_csv("./data/bmi.csv")
#讀取資料

label = tbl["label"]
#讀取資料中的標籤列
w = tbl["weight"] / 100 
h = tbl["height"] / 200 
wh = pd.concat([w, h], axis=1)

data_train, data_test, label_train, label_test = cross_validation.train_test_split(wh,label)
#將資料分成兩組資料集和測試集

clf = svm.LinearSVC()
clf.fit(data_train, label_train)
#訓練資料

predict = clf.predict(data_test)
#預測資料

ac_score = metrics.accuracy_score(label_test, predict)
#生成測試精度
cl_report = metrics.classification_report(label_test, predict)
#生成交叉驗證的報告
print(ac_score)
#顯示資料精度
print(cl_report)
#顯示交叉驗證資料集報告

執行結果

交叉驗證三組測試集平均預測精度為0.9182 參考文獻：《統計學習方法》《Web scraping and machine learning by python》

機器學習-實戰-入門-linearSVC和SVC,身高體重與胖瘦關係的分類與預測

機器學習-實戰-入門-MNIST手寫數字識別

機器學習實戰——線性迴歸和區域性加權線性迴歸（含python中複製的四種情形！）

書籍：《機器學習實戰》中文版 IDE：PyCharm Edu 4.02 環境：Adaconda3 python3.6 注：本程式相比原書中的程式區別，主要區別在於函式驗證和繪圖部分。一、一般線

機器學習實戰第7章——利用AdaBoost元算法提高分類性能

nes 重要性 function mine spl 技術可能 copy elar 將不同的分類器組合起來，這種組合結果被稱為集成方法或元算法（meta-algorithm）。使用集成方法時會有多種形式：（1）可以是不同算法的集成（2）可以是同一種算法在不同設置下的集成

機器學習實戰（二）LR演算法：實現簡單的分類模型

說明：，裡面有更詳盡的Logistic Regression原理分析和案例實現流程詳解，是一個關於機器學習實戰的不錯的學習資料，推薦一波。出於程式設計實踐和機器學習演算法梳理的目的，按照自己的程式碼風格重寫該應用案例，在實現的過程中也很有助於自己的思考。為方便下次看時能快速理

分享《機器學習實戰基於Scikit-Learn和TensorFlow》中英文PDF原始碼+《深度學習之TensorFlow入門原理與進階實戰》PDF+原始碼

下載：https://pan.baidu.com/s/1qKaDd9PSUUGbBQNB3tkDzw 《機器學習實戰：基於Scikit-Learn和TensorFlow》高清中文版PDF+高清英文版PDF+原始碼下載：https://pan.baidu.com/s/1IAfr-tigqGE_njrfSA

Python數據挖掘與機器學習技術入門實戰

機器學習摘要：什麽是數據挖掘？什麽是機器學習？又如何進行Python數據預處理？本文將帶領大家一同了解數據挖掘和機器學習技術，通過淘寶商品案例進行數據預處理實戰，通過鳶尾花案例介紹各種分類算法。課程主講簡介：韋瑋，企業家，資深IT領域專家/講師/作家，暢銷書《精通Python網絡爬蟲》作者，阿裏雲社區技術

分享《機器學習實戰：基於Scikit-Learn和TensorFlow》高清中英文PDF+原始碼

下載：https://pan.baidu.com/s/1kNN4tDt58ckFoD_OWH5sGw 更多資料分享：http://blog.51cto.com/3215120 《機器學習實戰：基於Scikit-Learn和TensorFlow》高清中文版PDF+高清英文版PDF+原始碼高清中文版PDF

分享《機器學習實戰：基於Scikit-Learn和TensorFlow》高清中英文PDF+源代碼

ESS alt mark 構建 image 機器學習實戰 dff com 化學下載：https://pan.baidu.com/s/1kNN4tDt58ckFoD_OWH5sGw 更多資料分享：http://blog.51cto.com/3215120 《機器學習實戰：基

機器學習實戰書籍和程式碼分享 | 【PCA簡介】

開頭先上圖機器學習是人工智慧研究領域中的一個極其重要的方向。在現今大資料時代的背景下捕獲資料並從中萃取有價值的資訊或模式使得這一過去為分析師與數學家所專屬的研究領域越來越為人們矚目。本書第一部分主要介紹機器學習基礎，以及如何利用演算法進行分類，並逐步介紹了多種經典的監督學習演

分享《機器學習實戰：基於Scikit-Learn和TensorFlow》+PDF+Aurelien

ext https oss 模型 img kit 復制 mage 更多下載：https://pan.baidu.com/s/127EzxtY9zdBU2vOfxEgIjQ 更多資料分享：http://blog.51cto.com/14087171 《機器學習實戰：基於Sc

python中的numpy和pandas---機器學習實戰第一篇KNN

http://www.cnblogs.com/prpl/p/5537417.html 熟悉其基本操作 from numpy import * import operator def data(): datas = array([[1.0,1.1],[1.0,1.0],[0,0]

機器學習：線性迴歸和嶺迴歸入門程式碼

機器學習中運用python進行對房子價格的預測程式碼，資料庫直接使用sklearn自帶的boston，使用三種方法進行預測，分別是：線性迴歸直接預測、梯度下降預測、嶺迴歸預測 from sklearn.datasets import load_boston fr

分享《機器學習實戰：基於Scikit-Learn和TensorFlow》高清中英文PDF+原始碼免費

下載：https://pan.baidu.com/s/191hQMWZYGhXtqZxbfqTDtw 《機器學習實戰：基於Scikit-Learn和TensorFlow》高清中文版PDF+高清英文版PDF+原始碼免費下載高清中文版PDF，649頁，帶目錄和書籤，文字能夠複製貼上；高清英文版PDF

人工智慧新書推薦——《PyTorch機器學習從入門到實戰》

人工智慧入門實踐，輕鬆玩轉PyTorch框架。校寶線上出品的書籍《PyTorch機器學習從入門到實踐》發售了！內容簡介近年來，基於深度學習的人工智慧掀起了一股學習的熱潮。本書是使用PyTorch深度學習框架的入門書籍。本書從深度學習原理入手，由淺入

《機器學習實戰》學習筆記（六）之提升和Adaboost（上）基礎理論以及演算法推導

轉載請註明作者和出處：http://blog.csdn.net/john_bh/ CSDN部落格專欄：## Github程式碼獲取：## 執行平臺： Windows Python版本： Python3.6 IDE： Sublime text3

【機器學習實戰系列】讀書筆記之AdaBoost演算法公式推導和例子講解（一）

最近在看整合演算法AdaBoost，推薦先看李航的統計學習方法第8章，然後再看機器學習實戰第7章，李航的書上的公式推導講的很詳細了，但是很多地方對於初學者來說，還是需要時間去理解和消化的。本文將從以下幾個方面來介紹AdaBoost演算法。一、AdaBoost演算法公式推導二、

【機器學習實戰】支援向量機----分類庫和簡單訓練mnist

前面已經對mnist資料集進行了讀取，現在我們可以直接使用sklearn.svm模組中的演算法庫對mnist資料集進行訓練。【svm模組】演算法庫： sklearn.svm模組中提供了這些庫：大概分成這幾類(除了svm_l1_min_c

《機器學習實戰》第五章：Logistic迴歸（1）基本概念和簡單例項

最近感覺時間越來越寶貴，越來越不夠用。不過還是抽空看了點書，然後整理到部落格來。加快點節奏，廢話少說。 Keep calm & carry on. ----------------------------------------------------------

Python資料探勘與機器學習技術入門實戰

課程主講簡介：韋瑋，企業家，資深IT領域專家/講師/作家，暢銷書《精通Python網路爬蟲》作者，阿里雲社群技術專家。以下內容根據主講嘉賓視訊分享以及PPT整理而成。本次課程包含了五個知識點： 1.資料探勘與機器學習技術簡介 2.Python資料預

機器學習-實戰-入門-linearSVC和SVC,身高體重與胖瘦關係的分類與預測

相關推薦