python--DataFrame隨機抽樣
平時工作中,經常遇到隨機抽樣的需求,可用Pandas庫中的sample函式,簡單又快捷。
官方文件解釋在這:sample
DataFrame.sample(n=None, frac=None, replace=False, weights=None, random_state=None, axis=None)
- n: 要抽取的行數,需為整數值
- frac:抽取的比列,需為小數值,比方說我們想隨機抽取30%的資料,則設定frac=0.3即可。
- replace:抽樣後的資料是否代替原DataFrame(),預設為False
- weights:預設為等概率加權
- random_state:隨機種子,本質是一個控制器,設定此值為任意實數,則每次隨機的結果是一樣的
- axis:抽取資料的行還是列,axis=0的時是抽取行,axis=1時是抽取列
import pandas
#隨機從rs資料集中抽取2000行資料,並且保證下次抽取時與此次抽取結果一樣
rs.sample(n=2000,random_state=123,axis=0)
#隨機從rs資料集中抽取50%的行資料
rs.sample(frac=0.5,axis=0)
相關推薦
python--DataFrame隨機抽樣
平時工作中,經常遇到隨機抽樣的需求,可用Pandas庫中的sample函式,簡單又快捷。 官方文件解釋在這:sample DataFrame.sample(n=None, frac=None, replace=False, weights=None, random_sta
python中隨機函數
import logs style pan 數字 字母 clas col cnblogs 1 #隨機函數 2 import random #導入random 3 #隨機生字符和數字的驗證碼 4 #(65-90)對應的ACIll碼對應的字符為a-z 5 temp
Python 生成隨機驗證碼
安裝 alt rndc 字母 .text key red 圖片查看 fill Python生成隨機驗證碼 Python生成隨機驗證碼,需要使用PIL模塊. 安裝: 1 pip3 install pillow 基本使用 1. 創建圖片
[Spark][Python]DataFrame中取出有限個記錄的例子
dep ins pytho rem json.js art hadoop fileinput taskset [Spark][Python]DataFrame中取出有限個記錄的例子: sqlContext = HiveContext(sc) peopleDF = sql
[Spark][Python]DataFrame select 操作例子
pytho partition rac executor logs part ner man add [Spark][Python]DataFrame中取出有限個記錄的例子 的 繼續 In [4]: peopleDF.select("age")Out[4]: Data
[Spark][Python]DataFrame where 操作例子
frame .sh data mit spark dia where () limit [Spark][Python]DataFrame中取出有限個記錄的例子 的 繼續 [15]: myDF=peopleDF.where("age>21") In [16]: my
[Spark][Python]DataFrame的左右連接例子
pytho ont logs state codes name () class clas [Spark][Python]DataFrame的左右連接例子 $ hdfs dfs -cat people.json {"name":"Alice","pcode":
[Spark][Python][DataFrame][SQL]Spark對DataFrame直接執行SQL處理的例子
hdfs temp div python people data name where afr [Spark][Python][DataFrame][SQL]Spark對DataFrame直接執行SQL處理的例子 $cat people.json {"name":"
R語言:隨機抽樣(sample函數)
.cn png 函數 -1 數據集 img image 如果 一個數 如果想從一堆數據集中隨機抽出一個數,用sample函數就能實現,代碼展示如下: forehead<-c(249,189,128,111,184,233,313,120,151,196,135,
人生苦短,我學python之python+selenium 隨機生成手機號碼和身份證
count read delta selenium 隨機 urn etime 手機號 身份證號 # coding:utf-8import osimport randomimport randomimport stringimport timefrom datetime im
python生成隨機驗證碼
python生成隨機密碼 random模塊生成隨機密碼 一、生成隨機驗證碼(純數字及字母加數字): import random import string checkcod=‘‘ for i in range(5): #5位驗證碼 ‘‘‘ #純數字驗證碼 #隨機值1-9取可
Python:隨機生成測試數據的模塊--faker的基本使用
成功 成本 ML 其他 IV 9.png 項目 spa 自己 本文內容: faker的介紹 faker的使用 小例子:生成隨機的數據表信息 首發日期:2018-06-15 faker介紹: faker是python的一個第三方模塊,是一個
python random 隨機選擇操作
int 長度 orm 隨機選擇 隨機生成 操作 sample shuffle random # -*- coding:utf-8 -*- import random arr = [‘A‘,‘B‘,‘C‘,‘D‘,‘E‘,‘F‘] #生成(0.0, 1.0)的隨機數 pri
python dataframe slice
中間 開始 frame arr imp font spa column slice import pandas as pd import numpy as np d=np.array(range(10)).reshape(2,5) data=pd.DataFrame(d)
python應用-隨機漫步
dir next 用法 utf auth ont axis point data 對python應用的一個鞏固,以及熟悉matplotlib的用法 效果如下: # -*- coding: utf-8 -*- """ Created on Fr
python生成隨機密碼:random庫
要求: (1)使用random庫,採用0x1010作為隨機種子。 (2)密碼由26個字母的大小寫,10個數字字元和!@#¥%……&*等8個字元組成。 (3)每個密碼長度固定在10個字元。 (4)程式執行每次長生20個密碼,每個密碼一行。 (5)每次長生的20個密碼儲存
python-DataFrame-報錯:ValueError: DataFrame constructor not properly called!
使用python-DataFrame對資料庫查詢資料進行處理 錯誤日誌如下: 原始碼: sku_base = DataFrame(sku_base_result, columns=sku_base_field) 問題原因: data資料格式問題,使用list(sku_base_
python中隨機漫步的寫法
from random import choice class RandomWalk(): def __init__(self,num_points=5000): self.num_points = num_points self.x_values
Python Dataframe遍歷,刪除,初始化操作
建立一個DataFrame,它有幾種建立方式: 列表,序列(pandas.Series), numpy.ndarray的字典 二維numpy.ndarray 別的DataFrame 結構化的記錄(structured arrays) 其中,我最喜歡的是通過二維ndarray建立DataF
Python——模組——隨機模組
1、引用模組 import random 2、隨機整數 random.randint(a,b) 3、隨機浮點數 random.uniform(a,b) 4、從列表中隨機取元素 random.choice() 5、在一定範圍內取數,c預設為空,若c有數值