Pandas資料離散化原理及例項解析

阿新 • • 發佈：2020-01-09

這篇文章主要介紹了Pandas資料離散化原理及例項解析,文中通過示例程式碼介紹的非常詳細，對大家的學習或者工作具有一定的參考學習價值,需要的朋友可以參考下

為什麼要離散化

連續屬性離散化的目的是為了簡化資料結構，資料離散化技術可以用來減少給定連續屬性值的個數。離散化方法經常作為資料探勘的工具
扔掉一些資訊,可以讓模型更健壯,泛化能力更強

什麼是資料的離散化

連續屬性的離散化就是在連續屬性的值域上，將值域劃分為若干個離散的區間，最後用不同的符號或整數值代表落在每個子區間中的屬性值

分箱

案例

1.先讀取股票的資料，篩選出p_change資料

data = pd.read_csv("./data/stock_day.csv")
p_change= data['p_change']

2.將股票漲跌幅資料進行分組

使用的工具：

pd.qcut(data,bins)——等深分箱：
- 對資料進行分組將資料分組一般會與value_counts搭配使用，統計每組的個數
series.value_counts()：統計分組次數

# 自行分組
qcut = pd.qcut(p_change,10)
# 計算分到每個組資料個數
qcut.value_counts()

自定義區間分組：

pd.cut(data,bins)——等寬分箱：
- bins是整數—等寬
- bins是列表--自定義分箱

# 自己指定分組區間
bins = [-100,-7,-5,-3,3,5,7,100]
p_counts = pd.cut(p_change,bins)

以上就是本文的全部內容，希望對大家的學習有所幫助，也希望大家多多支援我們。

Pandas資料離散化原理及例項解析

Java原子變數類原理及例項解析

這篇文章主要介紹了Java原子變數類原理及例項解析,文中通過示例程式碼介紹的非常詳細，對大家的學習或者工作具有一定的參考學習價值,需要的朋友可以參考下

Java記憶體模型原子性原理及例項解析

這篇文章主要介紹了Java記憶體模型原子性原理及例項解析,文中通過示例程式碼介紹的非常詳細，對大家的學習或者工作具有一定的參考學習價值,需要的朋友可以參考下

Java HashMap原理及例項解析

這篇文章主要介紹了Java HashMap原理及例項解析,文中通過示例程式碼介紹的非常詳細，對大家的學習或者工作具有一定的參考學習價值,需要的朋友可以參考下

java阻塞佇列實現原理及例項解析

這篇文章主要介紹了java阻塞佇列實現原理及例項解析,文中通過示例程式碼介紹的非常詳細，對大家的學習或者工作具有一定的參考學習價值,需要的朋友可以參考下

Python assert關鍵字原理及例項解析

這篇文章主要介紹了Python assert關鍵字原理及例項解析,文中通過示例程式碼介紹的非常詳細，對大家的學習或者工作具有一定的參考學習價值,需要的朋友可以參考下

Java switch使用原理及例項解析

這篇文章主要介紹了Java switch使用及例項解析,文中通過示例程式碼介紹的非常詳細，對大家的學習或者工作具有一定的參考學習價值,需要的朋友可以參考下

python匿名函式lambda原理及例項解析

這篇文章主要介紹了python匿名函式lambda原理及例項解析,文中通過示例程式碼介紹的非常詳細，對大家的學習或者工作具有一定的參考學習價值,需要的朋友可以參考下

JAVA面向物件封裝原理及例項解析

這篇文章主要介紹了JAVA面向物件封裝原理及例項解析,文中通過示例程式碼介紹的非常詳細，對大家的學習或者工作具有一定的參考學習價值,需要的朋友可以參考下

MyBatis快取功能原理及例項解析

快取 1、簡介查詢：連線資料庫，耗資源！一次查詢的結果，給他暫存在一個可以直接取到的地方！--->記憶體：快取

Java Lock介面實現原理及例項解析

1、概述 JUC中locks包下常用的類與介面圖如下：圖中，Lock和ReadWriteLock是頂層鎖的介面，Lock代表實現類是ReentrantLock（可重入鎖），ReadWriteLock（讀寫鎖）的代表實現類是ReentrantReadWriteLock。

Python閉包與裝飾器原理及例項解析

一、閉包閉包相當於函式中，巢狀另一個函式，並返回。程式碼如下： def func(name): # 定義外層函式

Python定時任務APScheduler原理及例項解析

定時任務： 1、執行緒睡眠函式 sleep() ——粗暴！一直佔有 CPU 資源，導致後續操作無法執行

Spring Cloud Stream微服務訊息框架原理及例項解析

隨著近些年微服務在國內的盛行，訊息驅動被提到的越來越多。主要原因是系統被拆分成多個模組後，一個業務往往需要在多個服務間相互呼叫，不管是採用HTTP還是RPC都是同步的，不可避免快等慢的情況發生，系統性能上很容

Spring IOC和DI實現原理及例項解析

什麼是Spring Spring是一個以IoC和AOP為核心的框架。 IoC（Inversion of Control ，控制反轉）是Spring的基礎。

C++寫時拷貝實現原理及例項解析

一、什麼是寫時拷貝寫入時複製是一種計算機程式設計領域的優化策略。其核心思想是，如果有多個呼叫者同時請求相同資源（如記憶體或磁碟上的資料儲存），他們會共同獲取相同的指標指向相同的資源，直到某個呼叫者試圖

JavaScript this指向相關原理及例項解析

記得初學 JavaScript 時，其中 this 的指向問題曾讓我頭疼不已，我還曾私自將其與閉包、原型（原型鏈）並稱 JS 武林中的三大魔頭。如果你要想在 JS 武林中稱霸一方，必須將這三大魔頭擊倒。個人認為在這三大魔頭中，

PHP array_reverse() 函式原理及例項解析

array_reverse (PHP 4,PHP 5,PHP 7) array_reverse—返回單元順序相反的陣列說明 array_reverse(array$array[,bool$preserve_keys=FALSE] ) :array

PHP number_format函式原理及例項解析

例項1 格式化數字： <?php echo number_format(\"1000000\").\"\"; echo number_format(\"1000000\",2).\"\";

Python DES加密實現原理及例項解析

加密流程首先說一下置換的意思，比如說有5678這個字串，置換表為2143，置換表中的數表示的是位置，所以字串變成6587。所有的置換表在程式中。（S盒置換不一樣，會另外說明）

Pandas資料離散化原理及例項解析

相關推薦