使用bedtools提取vcf多個位置的變異(extract multi-region of genotypes by bedtools)
阿新 • • 發佈:2018-07-26
提取 targe intersect doc pre orm mut 生成 dto
1、下載安裝bedtools;
2、生成bed文件;標準的bed文件格式如下:
chr7 127471196 127472363 Pos1 0 + 127471196 127472363 255,0,0 chr7 127472363 127473530 Pos2 0 + 127472363 127473530 255,0,0 chr7 127473530 127474697 Pos3 0 + 127473530 127474697 255,0,0 chr7 127474697 127475864 Pos4 0 + 127474697 127475864 255,0,0
如果你只有染色體、起始位置和終止位置信息的話,也無大礙。不大標準但是不傷大雅的bed文件格式如下:
chr7 127471196 127472363
chr7 127472363 127473530
chr7 127473530 127474697
chr7 127474697 127475864
3、提取多個位置的vcf文件;
bedtools intersect -a myfile.vcf.gz -b mutil-region.bed -header > output.vcf
使用bedtools提取vcf多個位置的變異(extract multi-region of genotypes by bedtools)