SAS學習筆記（五）——關於樣本劃分

阿新 • • 發佈：2019-02-03

資料集可劃分為訓練資料集和測試資料集

劃分時要注意：隨機性和等比例分層（訓練資料和測試資料有相同比例的目標事件）

/*進行等比例分層之前要對分層變數進行排序*/

proc sort data=data_base;

by y; /*y是目標變數*/

run;

/*surveyselect過程*/ 即設定引數的過程

proc surveyselect data=data_base

out=data_base1

samprate=.6667 /*設定分層的比例，例如訓練樣本為n1,測試樣本為n2，那麼samprate=n1/(n1+n2)*/

seed=1234 /*當設定為0時，每次執行surveyselect過程將產生不同的隨機序列，因此每次得到的訓練資料集和測試資料集都不一樣；當取值大於0，就會產生

相同的隨機序列，因此可以得到相同的訓練和測試資料集*/

outall;/* 原始資料全部輸出，新增標識變數1和0，分別屬於訓練和測試資料集*/

strata y;/*定義分層變數，使得最後的目標變數佔比相同*/

run;

/*輸出分層抽樣的比例圖*/

proc freq data=data_base1;

tables selected*y;

run;

/*輸出訓練和測試資料集*/

data train validation;

set data_base1;

if selected=1 then output train;

else output validation;

run;

以上是資料充足的情況下，資料不充足的時候，要採用交叉驗證法：

1）data_base分為A(1/3)和data_base1(2/3);

2）data_base1分為B(1/2)和C(1/2);

訓練資料集測試資料集

B C A

A B C

A C B

為了建立可靠的預測模型，目標事件觀測數佔訓練資料集總觀測數比例不應該低於10%，一般10%-15%

這樣的樣本成為平衡樣本。

主要處理在samprate=(samprate_1,samprate_2……samprate_n)

這裡引數是目標變數中各層級的取樣比例，例如目標變數是性別，則男女分別的取樣比例。

SAS學習筆記（五）——關於樣本劃分

資料集可劃分為訓練資料集和測試資料集劃分時要注意：隨機性和等比例分層（訓練資料和測試資料有相同比例的目標事件） /*進行等比例分層之前要對分層變數進行排序*/ proc sort data=data_base; by y; /*y是目標變數*/ run; /*surv

數據結構學習筆記（五）樹的創建和遍歷

一個後序遍歷 for -1 堆棧 nor ext cnblogs 復制創建（先序創建和根據先序和中序進行創建）和遍歷（先序遍歷、中序遍歷、後序遍歷、非遞歸堆棧遍歷、層次遍歷）：　　 package tree; public class XianCreateTree

最優化學習筆記（五）牛頓法及擬牛頓法

div size -a article fonts alt water src jsb 最優化學習筆記（五）牛頓法及擬牛頓法

javascript學習筆記（五）：異常捕獲和事件處理

log 類型按鈕輸入 button lan yellow logs 代碼異常捕獲 Try{ 　　發生異常的代碼塊 }catch(err){ 　　異常信息處理 } 1 <!DOCTYPE html> 2 <html> 3 <head

Spring 學習筆記（五）—— Bean之間的關系、作用域、自動裝配

mar byname pps etc 有時 sysman 對象實例構造 encoding 繼承　　Spring提供了配置信息的繼承機制，可以通過為<bean>元素指定parent值重用已有的<bean>元素的配置信息。 <?xml

Go語言學習筆記（五）文件操作

see 大小 unix rdo 筆記不能 hid code lag 加 Golang學習 QQ群共同學習進步成家立業工作 ^-^ 群號：96933959 文件讀取 os.File 封裝了文件相關操作 type File File代表一個打開的文件對象。

Unity3D之Mecanim動畫系統學習筆記（五）：Animator Controller

浮點 key 發現菜單融合 stat mon 好的 project 簡介 Animator Controller在Unity中是作為一種單獨的配置文件存在的文件類型，其後綴為controller，Animator Controller包含了以下幾種功能：可以對

Python學習筆記（五）OOP

默認 tro acl 引入支持不同 post set 成像模塊使用模塊import 模塊名。有的僅僅導入了某個模塊的一個類或者函數，使用from 模塊名 import 函數或類名實現。為了避免模塊名沖突。Python引入了按文件夾來組織模塊的方

如鵬網學習筆記（五）MySql基礎

修改列記錄 tex 令行金額升序查詢自動遞增 col MySQL基礎一、數據庫概念　　1，網友裝備信息、論壇帖子信息、QQ好友關系信息、學籍管理系統中的學生信息等都要“持久化”的保存到一個地方，　　　　如果通過IO寫到文件中，那麽會非常麻煩，而且不利於多人共享數

docker學習筆記（五）——Docker常用命令總結

docker學習筆記 docker常用命令總結 1. 開啟/停止/重啟container（start/stop/restart）容器可以通過run新建一個來運行，也可以重新start已經停止的container，但start不能夠再指定容器啟動時運行的指令，因為docker只能有一個前臺進程。容器st

jQuery學習筆記（五）

加載 complete += ron 序列 border () ajaxstart 單選 jQuery與Ajax的應用 Ajax的優勢和不足 Ajax的優勢 a）不需要插件支持 b）優秀的用戶體驗 c）提高Web程序的性能 d）減輕服務器和寬帶的負擔 Ajax的不

流暢的python和cookbook學習筆記（五）

pytho col () 學習 util 學習筆記取出 minute python 1.隨機選擇　　python中生成隨機數使用random模塊。　　1.從序列中隨機挑選元素，使用random.choice() >>> import random

Oracle 學習筆記（五）

采樣 flash 全表掃描 group space 表空間 manage 授權個數 --表空間,auto: 自動管理， manual: 手動管理 create tablespace tsp1 datafile ‘D:\ORACLE\ORADATA\O10\tsp1.

Hibernate學習筆記（五） --- 創建基於中間關聯表的多對多映射關系

mys 兩個 override pac tid 一對多 main ber different 多對多映射是在實際數據庫表關系之間比較常見的一種，仍然以電影為例，一部電影可以有多個演員，一個演員也可以參演多部電影，電影表和演員表之間就是“多對多”的關系針對多對多的映射關系，

Java8學習筆記（五）--Stream API詳解[轉]

有效編程效率實時處理 phaser 綜合 files -- bin 並發模式為什麽要使用StreamStream 作為 Java 8 的一大亮點，它與 java.io 包裏的 InputStream 和 OutputStream 是完全不同的概念。它也不同於 StAX

python學習筆記（五）數值類型和類型轉換

學習系統 oat cal 關於 trac hide sed lin Python中的數值類型有：　　整型，如2，520 　　浮點型，如3.14159，1.5e10 　　布爾類型 True和False e記法：　　e記法即對應數學中的科學記數法 1 >>

操作系統學習筆記（五）頁面置換算法

進入 es2017 問題簡單 .cn 討論相同一位四種操作系統將內存按照頁的進行管理，在需要的時候才把進程相應的部分調入內存。當產生缺頁中斷時，需要選擇一個頁面寫入。如果要換出的頁面在內存中被修改過，變成了“臟”頁面，那就需要先寫會到磁盤。頁面置換算法，就是要選出

Nginx 學習筆記（五）nginx-vod-module 模塊

filename star rec 上啟本地就是 gdb 裸奔 ted nginx-vod-module 一、編譯 ./configure --user=www --group=www --prefix=/usr/local/openresty --with-debu

python學習筆記（五）

推導式 for mod cal pos [] 類名 left 開頭 38、繼承子類繼承父類時，如果不寫init方法，表示繼承父類的init方法。如果寫了init方法，表示重寫父類的init方法。其他方法也是同理。對於變量也是同樣的道理。 class A: def __in

《Qt5 開發與實例（第三版）》學習筆記（五）

液晶 lag bool child gles 操作啟動 ring home 1 //2.5 控件 2 //2.51 按鈕組(Buttons) 3 /* 4 Radio Button //單選按鈕 5 Check Box//復選框 6 Dialog

SAS學習筆記（五）——關於樣本劃分

相關推薦