糖尿病模型預測

阿新 • • 發佈：2020-09-06

diabetes model prediction

"""
# @Time    :  2020/9/6
# @Author  :  Jimou Chen
"""
from sklearn.linear_model import LogisticRegression
import pandas as pd
import matplotlib.pyplot as plt
import seaborn
import numpy as np
import missingno as msn
from sklearn.metrics import classification_report
from sklearn.model_selection import train_test_split


def label_distribution(data):
    p = data.Outcome.value_counts().plot(kind='bar')  # 使用柱狀圖畫出
    plt.show()
    # 視覺化資料釋出, 有些資料本不該為0的卻為0，其實是空的
    p = seaborn.pairplot(data, hue='Outcome')
    plt.show()
    # 把空值的用柱狀圖畫出來
    p = msn.bar(data)
    plt.show()


def handle_data():
    data = pd.read_csv('data/diabetes.csv')
    # 檢視標籤分佈
    print(data.Outcome.value_counts())
    # 把葡萄糖，血壓，面板厚度，胰島素，身體質量指數中的0替換為nan
    handle_col = ['Glucose', 'BloodPressure', 'SkinThickness', 'Insulin', 'BMI']
    data[handle_col] = data[handle_col].replace(0, np.nan)

    # 設定閥值
    thresh_count = data.shape[0] * 0.8
    # 若某一列資料缺失的數量超過20%就會被刪除
    data = data.dropna(thresh=thresh_count, axis=1)

    # 填充資料，得到新的資料集data
    data['Glucose'] = data['Glucose'].fillna(data['Glucose'].mean())
    data['BloodPressure'] = data['BloodPressure'].fillna(data['BloodPressure'].mean())
    data['BMI'] = data['BMI'].fillna(data['BMI'].mean())

    return data


if __name__ == '__main__':
    new_data = handle_data()
    label_distribution(new_data)

    # 切分資料集
    x_data = new_data.drop('Outcome', axis=1)
    y_data = new_data.Outcome
    x_train, x_test, y_train, y_test = train_test_split(x_data, y_data, test_size=0.3, stratify=y_data)

    # 建模
    model = LogisticRegression()
    model.fit(x_train, y_train)

    # 預測
    pred = model.predict(x_test)
    # 評估
    print(classification_report(pred, y_test))

D:\Anaconda\Anaconda3\python.exe D:/Appication/PyCharm/Git/kaggle-project/DiabetesPrediction/diabetes_predict.py
0    500
1    268
Name: Outcome, dtype: int64
              precision    recall  f1-score   support

           0       0.90      0.80      0.85       169
           1       0.58      0.76      0.66        62

    accuracy                           0.79       231
   macro avg       0.74      0.78      0.75       231
weighted avg       0.81      0.79      0.80       231


Process finished with exit code 0

糖尿病模型預測

diabetes model prediction """ # @Time:2020/9/6 # @Author:Jimou Chen """ from sklearn.linear_model import LogisticRegression

pytorch模型預測結果與ndarray互轉方式

預測結果轉為numpy： logits=model(feature) #如果模型是跑在GPU上 result=logits.data.cpu().numpy()/logits.cpu().numpy()

python:目標檢測模型預測準確度計算方式(基於IoU)

訓練完目標檢測模型之後，需要評價其效能，在不同的閾值下的準確度是多少，有沒有漏檢，在這裡基於IoU(Intersection over Union)來計算。

強化學習 4 —— 時序差分法（TD）解決無模型預測與控制問題

在上篇文章強化學習——蒙特卡洛 (MC) 取樣法的預測與控制中我們討論了 Model Free 情況下的策略評估問題，主要介紹了蒙特卡洛（MC）取樣法的預測與控制問題，這次我們介紹另外一種方法——時序差分法（TD）

強化學習 3—— 使用蒙特卡洛取樣法（MC）解決無模型預測與控制問題

一、問題引入回顧上篇強化學習 2 —— 用動態規劃求解 MDP我們使用策略迭代和價值迭代來求解MDP問題

[Paddle學習筆記][12][基於YOLOv3的昆蟲檢測-模型預測]

說明：本例程使用YOLOv3進行昆蟲檢測。例程分為資料處理、模型設計、損失函式、訓練模型、模型預測和測試模型六個部分。本篇為第五部分，使用非極大值抑制來消除預測出的重疊面積過大的邊框，然後顯示預測結果影象。

【Matlab原始碼】基於管道的魯棒模型預測控制

這個知識庫包括管道模型預測控制（tube MPC）[1]以及用MATLAB編寫的通用模型預測控制（MPC）的示例。

2021.07.08-模型預測軌跡生成

本文程式碼來自於開源專案Cpprobotics中的model_predictive_trajectory_generator。目的：學習基於模型預測的軌跡生成演算法。為進一步學習無人車軌跡優化打基礎。

8基於模型預測控制的路徑規劃

Introduction Model System model(質點本身的運動) Problem model(一般需要非線性方法來解決)

【優化預測】基於matlab布穀鳥演算法優化灰色模型預測【含Matlab原始碼 1244期】

一、布穀鳥演算法簡介布穀鳥演算法，英文叫做Cuckoo search (CS algorithm)。首先還是同樣，介紹一下這個演算法的英文含義， Cuckoo是布穀鳥的意思，啥是布穀鳥呢，是一種叫做布穀的鳥，o(∩_∩)o ，這種鳥她媽很懶

從分子層面雕刻肌肉：新數學模型預測鍛鍊肌肉最優方式

9 月 6 日訊息在社交網路中，人們對於顏值和身材的追求無比狂熱：不露臉的腹肌照，健壯發達的肱二頭肌、胸肌，分分鐘讓人沉淪。無論是出於塑形減脂，還是保持精神活力的目的，健身都成為了大眾參與較多的運動方式，雖

帶你瞭解3類預訓練語音模型預測方法

摘要：在調研多篇論文後，筆者發現預訓練語音模型的預測方法基本可以分為以下3類：<1>用前文預測當前及後文（自迴歸）<2> 隨機mask 一些幀並預測 <3> 用兩側上下文預測中間幀。

拓端tecdat|R語言ARIMA整合模型預測時間序列分析

本文我們使用4個時間序列模型對每週的溫度序列建模。第一個是通過auto.arima獲得的，然後兩個是SARIMA模型，最後一個是Buys-Ballot方法。

拓端tecdat|R語言群組變數選擇、組懲罰group lasso套索模型預測分析新生兒出生體重風險因素資料和交叉驗證、視覺化

原文連結：http://tecdat.cn/?p=25158 原文出處：拓端資料部落公眾號本文擬合具有分組懲罰的線性迴歸、GLM和Cox迴歸模型的正則化路徑。這包括組選擇方法，如組lasso套索、組MCP和組SCAD，以及雙級選擇方法，如組指

Python資料探勘之時序模型預測

Python資料探勘之時序模型預測一、單變數序列預測 from statsmodels.tsa.arima.model import ARIMA

利用迴歸模型預測數值型資料(程式碼)

機器學習演算法按照目標變數的型別，分為標稱型資料和連續型資料。標稱型資料類似於標籤型的資料，而對於它的預測方法稱為分類，連續型資料類似於預測的結果為一定範圍內的連續值，對於它的預測方法稱為迴歸。

python構建指數平滑預測模型示例

指數平滑法其實我想說自己百度的… 只有懂的人才會找到這篇文章… 不懂的人…看了我的文章…還是不懂哈哈哈

Python實現新型冠狀病毒傳播模型及預測程式碼例項

1.傳染及發病過程一個健康人感染病毒後進入潛伏期（時間長度為Q天），潛伏期之後進入發病期（時間長度為D天），發病期之後該患者有三個可能去向，分別是自愈、接收隔離、死亡。

使用keras內建的模型進行圖片預測例項

keras 模組裡面為我們提供了一個預訓練好的模型，也就是開箱即可使用的影象識別模型

Keras 載入已經訓練好的模型進行預測操作

使用Keras訓練好的模型用來直接進行預測，這個時候我們該怎麼做呢？【我這裡使用的就是一個圖片分類網路】

糖尿病模型預測

diabetes model prediction

相關推薦