[Rcode]資料框的基礎操作【不定期更新】

阿新 • • 發佈：2019-01-06

一資料的篩選與處理

1 新增新的一列，把連續型變數（如身高）轉化為類別型變數

data$height[data$height>=3]<-NA #把異常值重新編碼為缺失值

data<-within(data,{

             heightcat<-NA

             heightcat[height>1.8]<-"taller"

             heightcat[height>=1.6&height<=1.8]<-"middle"

             heightcat[height<1.6]<-"shorter"})              #建立一個類別型變數給身高資料歸類

                                                             #注意這裡heightcat只是一個字元型變數，而不是一個有序型因子

                                                             #注意within的用法，可以修改資料框

2 變數的重新命名

#method 1

fix(data)   #互動修改

#method 2

names(data)[i]<-"newname"

#method 3

library(plyr)

rename(data,c(oldname="newname",oldname="newname"))

3 缺失值處理

is.na(data[,1:5]) #識別缺失值

na.omit(data) #移除所有含有缺失值的觀測（即刪除行）

#原始資料中a<=0,b<=0,c<=0則表示缺失,用於刪除含缺失值的行

data<-read.csv("d:/data.csv",header=T,sep=",")

attach(data)

index=a>0&b>0&c>0

data<-data[index,]

4 資料集取子集

newdata<-data[,6:10]                                                                #直接挑選變數

newdata<-data[c(-1,-2)]                                                             #刪除第一個和第二個變數，等價於data$var1<-data$var2<-NULL

# 選擇觀測

newdata<-data[1:3,]                                                                 #直接選擇行

newdata<-data[data$heightcat=="taller"&data$height>1.5,]                            #使用attach函式就不用加美金符號

#subsset函式

newdata<-subset(data,height>=1.7|height<1.5,select=c(height,heightcat))

newdata<-subset(data,heightcat=="taller",select=height:heightcat)

[Rcode]資料框的基礎操作【不定期更新】

一資料的篩選與處理 1 新增新的一列，把連續型變數（如身高）轉化為類別型變數 data$height[data$height>=3]<-NA #把異常值重新編碼為缺失值data<-within(data,{ heightcat&l

常用Javascript集錦【不定期更新】

play [0 blog tin html元素 tex innerhtml nsh text 怎樣用javascript刪除某個HEML標簽 document.getElementById(id).parentNode.removeChild(document.getEl

【不定期更新】FPGA/IC崗位常見筆試面試題總結

1 數字IC（ASIC）設計流程：　　規格定製、詳細設計、HDL編碼、模擬驗證、邏輯綜合（產生網表）、靜態時序分析（STA）、形式驗證（對比綜合後網表與HDL設計功能是否一致）。之後包括佈局佈線（進行硬體模組和連線資源對映）等操作，最終生成驗證後的版圖檔案用於流片。其中綜合是劃分IC設計前端和後端的界限。

晒晒我的vimrc配置【不定期更新】

更新：最新vim配置位置 https://github.com/wklken/k-vim 下面的內容可以不用看了..... ===================================== 原先貼過一章 linux alias: http://blog

晒晒我的linux alias檔案【不定期更新】

下週三，工作滿一週年了。一步一個腳印，最近在整理一些配置相關的東西，重新梳理總結了下一年所學所得。 ------------------------------------------------------------------------------

【不定期更】【友鏈整理】

out log perl 江蘇省 tle res 定期 logs cdc 沒啥用，就是想整理下自己的友鏈： yanQval http://www.cnblogs.com/yanQval 江蘇省淮陰中學 nonam

sql server 操作（不定期更新）

要求：基本的語法要清楚。 sql server疑難點： 1、Partition by可以理解為對多行資料分組後排序取每個產品的第一行資料先處理內查詢，由內向外處理，外層查詢利用內層查詢的結果巢狀查詢不僅僅可以用於父查詢select語句使用。還可以用於insert、update、delet

【備忘】【不定時更新】那些有用有趣的網站君們~~

喜歡就加為收藏！ oeasy，會玩才會學：http://oeasy.org/ 學電腦軟體、黑技術，老師很萌一畫換一畫：http://www.sketchswap.com/ 你畫一幅畫，提交後，交換一副來自世界某個地方某個人的另一幅畫

vim命令【不定時更新】

移動游標上一行：k 下一行：j 上一字元：h 下一字元：l 下一個單詞的首字母：w 查詢替換查詢： /keyword 替換：全文替換： :%s /src/dst/g 文字操作撤銷： :u

【不定時更新】記錄舍友李優雅的前端學習歷程

前記：css其實算是前端裡邊比較基礎的部分，但是有些意外的小情況卻足夠讓人煩不勝煩，恰巧舍友李優雅正自學前端，遇到了一些問題，我想著不妨記錄下來，等到她熟練掌握了之後再拿過去嘲笑她。。。 case 1: 李優雅：你快幫我看一下，為什麼顯示不出圖片來！！ h

關於在eclipse中匯入android support design包出錯的問題【不定時更新】

今天想使用TabLayout實現選項卡布局，（我用的是eclipse+ADT）不料匯入android support design包的時候報錯了（error: Error: No resource found that matches the given name: att

【整理】常用電子設備功耗（不定期更新）

沒事標準優酷運行充電電子組裝由器 1.2 NAS 關機：1.4W（我擦，關機還耗電，還不少）待機：20W 運行：20W+每塊3.5寸硬盤5W PC 關機：1.2W 待機：45W（要不是你太吵，那你當nas也可以）處理器滿負荷：100W 顯卡滿負荷：180

UML類圖，類，方法，接口實現等基礎操作【入門】

style 怎麽辦畫出圖形 tro strong font .html 基礎操作 1.轉自：http://blog.sina.com.cn/s/blog_5bd6b4510101585x.html 在visio中畫類圖時，我們一般需要畫出接口和實現類並且表明他們的實

【SSH網上商城專案實戰15】執行緒、定時器同步首頁資料（類似於部落格定期更新排名）

轉自：https://blog.csdn.net/eson_15/article/details/51387378 上一節我們做完了首頁UI介面，但是有個問題：如果我在後臺添加了一個商品，那麼我必須重啟一下伺服器才能重新同步後臺資料，然後重新整理首頁才能同步資

Ubuntu 16.04 檔案及資料夾基礎操作

檢視檔案：cat 路徑名進入資料夾操作：當前位置 cd . 上一級檔案位置 cd .. 返回上一步操作 cd - 進入Home檔案 cd

python基礎（不定期更新）

1、python 尋找list中最大值、最小值並返回其所在位置 c = [1,2,4,0] c.index(min(c)) c.index(max(c)) 2、獲取N天、N小時、N分鐘前的時間 from datetime import datetime from date

Python基礎學習篇-7 各種常見報錯及原因----【不定時補充】

1、TypeError: int(x) argument must be a string, a bytes-like object or a number, not 'NoneType' 此報錯是因為使用 int() 函式進行強制型別轉換時，要求引數x必須是字串、位元組物件、數字，不能是其它的

【CV學習筆記】———— 基本圖片處理知識（此坑還未填完，不定期更新）

題外話：最近一段時間學校比賽賊多，都是一些創新創業類的，超級費腦子，每天晚上都是一波頭腦風暴，找老師找小夥伴一起討論，每次都是第一天的點子第二天就被我們自己否決了，不得不說，創新創業類的比賽發現機會的眼光很重要，勇氣更重要 ——————————————————————————以下為正文—

【eos不定期更新的日常】系統合約最近升級了什麼？

簡介最近實在太懶惰了，再勤快點寫篇eos最近的動向為大家充充電。所謂幣圈一日，人間一年，eos主網上線不知不覺已經三個月了，其中有很多bug亟待block.one解決。最近一次的系統合約升級，就有效的解決了好幾個系統問題。升級流程 eosio賬戶的許可權，已經被21

R語言Data Frame資料框常用操作

Data Frame一般被翻譯為資料框，感覺就像是R中的表，由行和列組成，與Matrix不同的是，每個列可以是不同的資料型別，而Matrix是必須相同的。 Data Frame每一列有列名，每一行也可以指定行名。如果不指定行名，那麼就是從1開始自增的Sequence來標

[Rcode]資料框的基礎操作【不定期更新】

一 資料的篩選與處理

1 新增新的一列，把連續型變數（如身高）轉化為類別型變數

2 變數的重新命名

3 缺失值處理

4 資料集取子集

相關推薦

一資料的篩選與處理