備用帖子1Shell(Shell R語言)
shell==========================
ls -lrt ### list fils by date (sort by date)
echo 1 > /proc/sys/vm/drop_caches 清理記憶體 free -m
du -h --max-depth=1 folder
awk '$0 ~ ">hsa" { print $0; getline str; print str; } ' 20150417.fa
只取檔名:
ll *tsv | sed 's/.*://g' | sed 's/.* //g'
R: letters[1:26]
echo -en "\007" #beep
echo "echo -en '\007'" >> t.sh
=CHAR(96+ROW())
xxx.sh >00.logs 2>&1 &
join -a 1 file1 file2 > mergedfile
#sort the bam files by name
for f in *.bam; do samtools sort -n "$f" "${f%.*}".sorted; done
#convert bam to sam
for f in *sorted.bam; do samtools view "$f" > "${f%.*}".sam; done
#convert sam to read counts
for f in *.sam; do python -m HTSeq.scripts.count "$f" Mus_musculus.GRCm38.75.gtf > "${f%.*}".readcount.txt ; done
split -l 2000 seq_2 -d -a 2 split_ 按行拆分檔案
sed '1i "geneid"' filename 插入一行內容在第一行
sed -i '1iabc' urfile 插入一行內容在第一行
-S <作業名稱> 指定screen作業的名稱。
grep -A 1 'EN03347' ripts.fa 輸出匹配的行及其下一行
# screen -X quit 退出screen
# awk '{if(length($3)>30)print $0}' urfile
awk分割資訊後獲取最後一列 cat $(ll /home/sdzw/tcf/20110914_001/|awk '{print $NF}')|grep "abc"
echo "Cfoo'barxml" | sed "s/'/::/g" | sed 's/::/\\:/g' | sed "s/:/'/g" 替換單引號為 \'
rpm -qa | grep mysql // 這個命令就會檢視該作業系統上是否已經安裝了mysql資料庫
grep -n 'key' file 顯示行號
sed -n '1,5p' file
exit 0; 成功,退出指令碼;
exit 1; 失敗,退出指令碼;
dos2unix filename 用:set ff=unix把它強制為unix格式
sed -n '100,200p' mysql_slow_query.log 只檢視檔案的第100行到第200行
awk '$7=="." {print $0}' merged.gtf
awk '$7!="." {print $0}' merged.gtf
find ./ -name '*extractfastabyid*' -print
grep -wq "Run complete" ERR266361.err && echo "SRR000000 tophat 執行正常; " || echo "SRR000000 tophat 執行錯誤; "
nohup command > myout.file 2>myerr & 使用 jobs 檢視任務。使用 fg %n 關閉。
ps aux | grep pbs
pkill "pbs_*"
pbs_server
pbs_sched
pbs_mom
pbsnodes -a
echo 'sleep 20' | qsub
qmgr -c 'print server'
cat /var/spool/torque/server_name
grep 'exon_number \"1\"' /filename | wc
grep -v 'ENS4810' file 不包含ENS4810 的行
sed -e 's/abc//g' file
:set list 進入List Mode;:set nolist 退出List Mode
awk 'NR==FNR{a[FNR]=$0} NR>FNR{for(i in a)if($0~a[i]){print;getline;print}}' Aid Bfilt >Cnew
R==========================
do.call('rbind',strsplit( as.character(one$tr) ,split='_'))
b1=paste(triples[,1],triples[,2],triples[,3],sep='_')
expr[expr$cell_type %in% c("hesc","bj fibroblast"),]
subset(expr, cell_type =="hesc")
subset(expr, cell_type %in% c("bj fibroblast","hesc"))
data(mtcars)
mtcars[mtcars[, "mpg"]>25, ]
mtcars[mtcars$mpg>25, ]
subset(mtcars, mpg>25)
colnames(data)[2] <- 'column 2'
colnames(data) <- c( 'col 1', 'col 2', 'col 3')
install.packages("ggplot2")
sample()函式可以用於在特定群體中,隨機 選取特定數目的個體。即隨機抽樣。
sample(x, size, replace = FALSE, prob = NULL) replace=F,表示不重複抽樣 replace=T 表示可以重複抽樣
R:fileConn<-file(pbs_file_name)
writeLines(str, fileConn)
close(fileConn)
R:x=c("aa","bb","cc")
for (i in 1:length(x))
{
str=x[i]
cat(str)
}
subset(dataset, gender=="M" | age < 50)
DF.new <- subset(DF, (gender == "female") & (age > 50))
May be this help you; Just intall.packages("sqldf", dependencies=T)
require(sqldf)
my_df<-data.frame(cbind(gender=sample(c("male","female"),50,replace=T),
age=round(rnorm(50, mean=30, sd=5),0)))
my_df_subset_male<-sqldf("select * from my_df where gender=='male'")
my_df_subset_male_greater35<-sqldf("select * from my_df where gender=='male'
and age>35")
df[,c('sequence','start','end')]
df[grep("trna", df$common_name, ignore.case=T),]
a[rownames(a)=='a',]
http://code.google.com/p/sqldf/
filter<-fpkm$geneid %in% df.ids$id
df.new<-fpkm[filter,]
dev.new(width=5, height=4) #視窗大小尺寸 http://www.cnblogs.com/emanlee/p/3332493.html
相關推薦
備用帖子1Shell(Shell R語言)
shell========================== ls -lrt ### list fils by date (sort by date) echo 1 > /proc/sys/vm/drop_caches 清理記憶體 free -m du -h --max-depth=1 fol
《深度學習精要(基於R語言)》高清中文版PDF+高清英文版PDF+源代碼
dbd 語言 process sha http com cto oss RoCE 下載:https://pan.baidu.com/s/11zySQB5f0s9SXNgJdBOphg 更多最新的資料:http://blog.51cto.com/3215120 《深度學習精要
分享《深度學習精要(基於R語言)》+PDF+源碼+Joshua F.Wiley+高蓉
blog aaa 講解 pro 高清 water tex href ces 下載:https://pan.baidu.com/s/14UlxD5VJRY92UpP7Wr6Taw 更多最新的資料:http://blog.51cto.com/14087171 《深度學習精要(基
統計學習方法——感知機演算法(基於R語言)
演算法2.1 train <- function(mat) { nr <- nrow(mat) nc <- ncol(mat) w0 <- matrix(0,nc - 1,1) b0 <- 0
中文分詞實踐(基於R語言)
背景:分析使用者在世界盃期間討論最多的話題。 思路:把使用者關於世界盃的帖子拉下來,然後做中文分詞+詞頻統計,最後將統計結果簡單做個標籤雲,效果如下: 後續:中文分詞是中文資訊處理的基礎,分詞之後,其實還有特別多有趣的文字挖掘工作可
信用卡評分模型(R語言)
eric 線圖 樣本 tag 匯總 lines lan 識別 param 信用卡評分 一、數據準備 1、 問題的準備 ? 目標:要完成一個評分卡,通過預測某人在未來兩年內將會經歷財務危機的可能性來提高信用評分的效果,幫助貸款人做出最好的決策。 ? 背景: –
用一個簡單的例子比較SVM,MARS以及BRUTO(R語言)
err r語 模型訓練 n! 也有 kernel 訓練 tps mea 背景重述 本文是ESL: 12.3 支持向量機和核中表12.2的重現過程。具體問題如下: 在兩個類別中產生100個觀測值。第一類有4個標準正態獨立特征\(X_1,X_2,X_3,X_4\)。第二類也有四
協方差矩陣和相關係數矩陣(R語言)
一、協方差矩陣 1.協方差定義 &n
同一介面畫出多個QQ圖(R語言)
題目:一名研究者用光子吸收法測量了婦女骨骼中無機物含量,對三根骨頭主側和非主側記錄了測量值,資料框“T1bones.txt”中的第2至第7列記錄了相應資料。對各個變數做qq圖,在同一個介面畫出所有的qq圖,不同的qq圖用不同顏色表示。 檔案:T1bones.txt 受試者編號&n
機器學習演算法簡介和程式碼(P&R語言)
機器學習演算法,P&R語言 一般說來,機器學習有三種演算法: 1. 監督式學習 監督式學習演算法包括一個目標變數(因變數)和用來預測目標變數的預測變數(自變數)。通過這些變數我們可以搭建一個模型,從而對於一個已知的預測變數值,我們可以得到對應的目標變數值。重複訓練這
決策樹模型(R語言)
R語言中最常用於實現決策樹的有兩個包,分別是rpart包和party包,其區別如下: rpart包的處理方式:首先對所有自變數和所有分割點進行評估,最佳的選擇是使分割後組內的資料更為“一致”(pure)。這裡的“一致”是指組內資料的因變數取值變異較小。rpart包對這種“一
統計學——中心極限定理(R語言)
中心極限定理用通俗的話來講就是,假設有一個服從(μ,σ2)的總體,這個總體的分佈可以是任意分佈,不用是正態分佈,既可以是離散的,也可以是連續的。我們從該分佈裡隨機取n個樣本x1,x2,...,xn,然後求這些樣本的均值x_mean,這個過程我們重複m次,我們就會得到x_me
轉載使用隨機森林(R語言)做迴歸
引言隨機森林( random forest) 是一種基於分類樹( classification tree) 的演算法,它可以用於分類和迴歸,本文在這裡以廣西地區1990-2014共25年的GDP資料作為因變數,以INV投資、CON消費、NEX淨出口為三個自變數,運用R語言軟體做隨機森林迴歸,最終得到三個自變數
(R語言)編寫自己的函式
10.1 函式的定義 > name <- function(arg_1, arg_2, ...) expression expression是一個R表示式(通常是表示式語句組),並使用引數arg_i來計算出一個數值,表示式的值就是函式的返回值。函式呼叫的形式通常
R(2)時間序列分析及應用之TSA安裝(R語言)
1,關於時間序列 時間序列分析(Time series analysis)是一種動態資料處理的統計方法。該方法基於隨機過程理論和數理統計學方法,研究隨機資料序列所遵從的統計規律,以用於解決實際問題。 2,安裝TSA 然後安裝TSA,但是TS
手把手教線性迴歸分析(附R語言例項)
本文長度為8619字,建議閱讀15分鐘本文為你介紹線性迴歸分析。通常在現實應用中,我們需要去理解
bash參考手冊之五(shell變量)續三
行號 gnu 可能 cpu border 位置 其它 post 換行 LINENO 當前在運行的腳本或者shell函數的行號。 LINES 命令select用來確定打印選擇列表的列寬。收到SIG
(轉)IBM AIX系統硬件信息查看命令(shell腳本)
容量 sed proc back 采集 模式 lex std lsp IBM AIX系統硬件信息查看命令(shell腳本) 原文:http://blog.itpub.net/22085031/viewspace-1054015/ 查看IBM AIX系統的主機型號、序列號、C
IDEA裏如何實現自動導入包和導入包優化的設置?(適合各種語言)(圖文詳解)
pic add 分享 str sca 詳解 個人博客 optimize html 不多說,直接上幹貨! 前言 為什麽需要自動導入包?為什麽需要導入包優化呢? 答: IDEA裏如何實現自動導
IDEA學習系列之剖析IDEA裏的Code Style(適合各種語言)(不斷更新)(圖文詳解)
ESS javascrip 挖掘 python pre scrip 學習 裏的 yaml 不多說,直接上幹貨! File -> Settings -> Editor -> Code Style