上取樣/下采樣

阿新 • • 發佈：2021-06-23

樣本不均衡時解決方式

在實際應用中經常出現樣本類別不均衡的情況，此時可以採用上取樣或者下采樣方法

上取樣

上取樣就是以資料量多的一方的樣本數量為標準，把樣本數量較少的類的樣本數量生成和樣本數量多的一方相同，稱為上取樣。

下采樣

下采樣，對於一個不均衡的資料，讓目標值(如0和1分類)中的樣本資料量相同，且以資料量少的一方的樣本數量為準。獲取資料時一般是從分類樣本多的資料中隨機抽與少數量樣本等數量的樣本。

上取樣SMOTE

　　SMOTE（Synthetic Minority Oversampling Technique）合成少數類過取樣技術，SMOTE演算法的基本思想是對少數類樣本進行分析並根據少數類樣本人工合成新樣本新增到資料集中。

　　演算法流程如下：

　　 1. 對於少數類中的每一個樣本x，用歐式距離為標準計算它到少數類樣本集中所有樣本的距離，得到其k近鄰

　　 2. 確定取樣倍率N,對於每一個少數類樣本x,從其k近鄰中隨機選擇若干個樣本，假設選擇的近鄰為x_i

　　 3. 對於每一個隨機選出的近鄰x_i，分別與原樣本按照如下的公式構建新的樣本

　　即x和x_i之間的連線上隨機選一點作為新構造的樣本

生成樣本的數量和分類樣本較多的資料量保持一致。

使用程式碼：

from imblearn.over_sampling import SMOTE
 
sm = SMOTE(random_state = 42, n_jobs = -1)
 
x, y  
= sm.fit_sample(x_val, y_val)

函式說明：

imblearn.over_sampling.SMOTE(

sampling_strategy = ‘auto’,

random_state = None, ## 隨機器設定

k_neighbors = 5, ## 用相近的 5 個樣本（中的一個）生成正樣本

m_neighbors = 10, ## 當使用 kind={'borderline1', 'borderline2', 'svm'}

out_step = ‘0.5’, ## 當使用kind = 'svm'

kind = 'regular', ## 隨機選取少數類的樣本

– borderline1： 最近鄰中的隨機樣本b與該少數類樣本a來自於不同的類

– borderline2： 隨機樣本b可以是屬於任何一個類的樣本;

– svm：使用支援向量機分類器產生支援向量然後再生成新的少數類樣本

svm_estimator = SVC(), ## svm 分類器的選取

n_jobs = 1, ## 使用的例程數，為-1時使用全部CPU

ratio=None )

參考文件：

https://blog.csdn.net/nextdoor6/article/details/82832593

https://blog.csdn.net/haoji007/article/details/106166305/

上取樣/下采樣

樣本不均衡時解決方式在實際應用中經常出現樣本類別不均衡的情況，此時可以採用上取樣或者下采樣方法

影象的上取樣（upsampling）與下采樣（subsampled）

http://blog.csdn.net/majinlei121/article/details/46742339 http://blog.csdn.net/augusdi/article/details/9028365

pytorch中的上取樣以及各種反操作,求逆操作詳解

import torch.nn.functional as F import torch.nn as nn F.upsample(input,size=None,scale_factor=None,mode=\'nearest\',align_corners=None)

pytorch進行上取樣的種類例項

1、其中再語義分割比較常用的上取樣：其實現方法為： def upconv2x2(in_channels,out_channels,mode=\'transpose\'):

在keras裡實現自定義上取樣層

Keras裡的UpSampling2D層不是中的雙線性內插，而是簡單的重複影象。這點和pytorch不一樣，pytorch預設使用的是雙線性內插。

劍指Offer_#32_從上到下列印二叉樹

劍指Offer_#32_從上到下列印二叉樹劍指offer Contents 劍指Offer32-I:不分行從上到下列印二叉樹題目思路分析演算法流程解答劍指Offer32-II:分行從上到下列印二叉樹題目思路分析解答劍指Offer32-III:之字形從上到下

Pytorch上下采樣函式--interpolate用法

最近用到了上取樣下采樣操作，pytorch中使用interpolate可以很輕鬆的完成 def interpolate(input,size=None,scale_factor=None,mode=\'nearest\',align_corners=None):

從上到下列印二叉樹，按行列印（Python and C++解法）

題目：從上到下按層列印二叉樹，同一層的節點按從左到右的順序列印，每一層列印到一行。

Feign呼叫檔案上傳服務介面樣例

　　前面做了Feign呼叫檔案下載服務介面的例子，這裡順帶把Feign呼叫檔案上傳服務介面的例子也一起做了！一樣直接上程式碼：

從上到下列印二叉樹

解題：利用佇列先進先出來實現層次遍歷 /** * Definition for a binary tree node. * public class TreeNode {

從上到下列印二叉樹 II

還是層次遍歷返回值型別不同罷了 /** * Definition for a binary tree node. * public class TreeNode {

從上到下列印二叉樹 III

題解：層次遍歷的基礎上加個計數器，偶數層得到的結果反轉一下 /** * Definition for a binary tree node.

js 寫點選上一月下一月時候切換

<el-col :span=\"5\"v-show=\"listVisible\" style=\"margin-left: 50px\"> <el-button type=\"primary\" size=\"mini\"@click=\"onday\">上一月</el-button>

從上到下按層列印二叉樹，同一層結點從左至右輸出。每一層輸出一行

思路：遞迴，擴容增加一個deep引數，內部list數量與deep相同，每個深度對應一個list

面試題32：從上到下列印二叉樹

從上到下列印二叉樹，引用輔助佇列。 C++版本 #include <iostream> #include <vector>

面試題32_2：分行從上到下列印二叉樹

分行從上到下列印二叉樹（其實就是廣度優先遍歷），引用輔助佇列。不管是廣度優先遍歷一幅有向圖還是一棵樹，都要用到佇列。首先把起始節點（對樹而言是根節點）放入佇列。接下來每次從佇列的頭部取出一個節點，遍

劍指 Offer 32 - I. 從上到下列印二叉樹(層序遍歷BFS)

題目描述從上到下打印出二叉樹的每個節點，同一層的節點按照從左到右的順序列印。

劍指22.從上往下列印二叉樹

題目描述從上往下打印出二叉樹的每個節點，同層節點從左至右列印。思路考的是二叉樹的層序遍歷。從下圖可以看出，每次列印一個節點的時候，如果該節點有子節點，則把該節點的子節點放到一個佇列的尾部。接下來

劍指 Offer 32 - III. 從上到下列印二叉樹 III

題目描述請實現一個函式按照之字形順序列印二叉樹，即第一行按照從左到右的順序列印，第二層按照從右到左的順序列印，第三行再按照從左到右的順序列印，其他行以此類推。

劍指 Offer 32 - III. 從上到下列印二叉樹 III - 8月13日

題目劍指 Offer 32 - III. 從上到下列印二叉樹 III 我的思路我的思路是按照題目要求的順序遍歷並列印。因為後一層遍歷的第一個節點可能是是前一層遍歷的最後一個節點的孩子，所以使用兩個棧，一個棧儲存當前層，

上取樣/下采樣

相關推薦