處理基因組數(shù)據(jù),很多時候我們會覺得直接看序列文件不夠直觀,如果繪圖的話,把n多G把數(shù)據(jù)用畫圖出來不僅費勁,就算操作也不方便。因此我們可以用UCSC開發(fā)出的genome browser,可以直接把數(shù)據(jù)信息寫成track,連上genome browser 上查看,它還支持安裝到本地服務器上(genome browser in box ,簡稱GBIB),genome browser 支持的格式有bedGraph, GTF, PSL, BED, bigBed, WIG, bigGenePred, bigMaf, bigChain, bigPsl, bigWig, BAM, CRAM, VCF, MAF, BED detail, Personal Genome SNP, broadPeak, narrowPeak, and microarray (BED15),GFF和GTF文件必須tab分隔。 廢話少說,直接入門。本文主要講SAM,BAM,WIG,bigWig,VCF,BED文件上傳及使用。

 

    一、格式的前期處理

      1.1    WIG 和 bigWig

      WIG 文件格式,有兩種可選的格式,variableStep和fixedStep。variableStep用于區(qū)間變化的,fixedStep用于區(qū)間固定的。

      variableStep WIG文件以variableStep 開頭,chrom染色體,可選參數(shù)span(默認span=1),指定每一行的位置區(qū)間,比如2,區(qū)間就是chromStart~chromStart+2。chromStart染色體位置,dataValue染色體位置上的值。

1 variableStep  chrom=chrN2 [span=windowSize]3 chromStartA  dataValueA4 chromStartB  dataValueB5 ... etc ...  ... etc ...

網(wǎng)友評論