bwa軟件用法是怎樣的,相信很多沒有經(jīng)驗的人對此束手無策,為此本文總結(jié)了問題出現(xiàn)的原因和解決方法,通過這篇文章希望你能解決這個問題。
成都創(chuàng)新互聯(lián)公司成立于2013年,我們提供高端成都網(wǎng)站建設(shè)公司、成都網(wǎng)站制作公司、成都網(wǎng)站設(shè)計公司、網(wǎng)站定制、成都全網(wǎng)營銷推廣、小程序設(shè)計、微信公眾號開發(fā)、成都網(wǎng)站營銷服務(wù),提供專業(yè)營銷思路、內(nèi)容策劃、視覺設(shè)計、程序開發(fā)來完成項目落地,為成都效果圖設(shè)計企業(yè)提供源源不斷的流量和訂單咨詢。
bwa 是一款將序列比對到參考基因組上的軟件,包含了以下3種算法
BWA-backtrack
BWA-SW
BWA-MEM
BWA-backtrack
適合比對長度不超過100bp的序列;BWA-SW
和BWA-MEM
適合于長度為70-1M bp的序列;其中BWA-MEM
是最新開發(fā)的算法,對于高質(zhì)量的測序數(shù)據(jù),其比對的速度更快,精確度更高,對于70-100bp的reads, BWA-MEM算法在比對長度為70-100bp的序列時,效果比BWA-backtrack 算法的效果更好??偠灾?,通常情況下,選擇BWA-MEM
算法就好。
bwa 的源代碼存儲在github
上,
安裝過程如下:
git clone https://github.com/lh4/bwa.git
cd bwa
make
安裝好之后,會出現(xiàn)一個名為bwa
的可執(zhí)行文件,輸入下面命令可以查看幫助信息
./bwa
Program: bwa (alignment via Burrows-Wheeler transformation) Version: 0.7.17-r1188 Contact: Heng Li <<a href="mailto:lh4@sanger.ac.uk" _href="mailto:lh4@sanger.ac.uk">lh4@sanger.ac.uk</a>> Usage: bwa <command> [options] Command: index index sequences in the FASTA format mem BWA-MEM algorithm fastmap identify super-maximal exact matches pemerge merge overlapping paired ends (EXPERIMENTAL) aln gapped/ungapped alignment samse generate alignment (single ended) sampe generate alignment (paired ended) bwasw BWA-SW for long queries shm manage indices in shared memory fa2pac convert FASTA to PAC format pac2bwt generate BWT from PAC pac2bwtgen alternative algorithm for generating BWT bwtupdate update .bwt to the new format bwt2sa generate SA from BWT and Occ Note: To use BWA, you need to first index the genome with `bwa index'. There are three alignment algorithms in BWA: `mem', `bwasw', and `aln/samse/sampe'. If you are not sure which to use, try `bwa mem' first. Please `man ./bwa.1' for the manual.
可以看到由很多的子命令構(gòu)成。
bwa
軟件的作用是將序列比對到參考基因組上,在比對之前,首先需要對參考基因組建立索引,命令如下:
bwa index in.fasta
索引建立好之后,會生成5個文件,后綴分別為
bwt
pac
ann
amb
sa
下面是對小鼠基因組構(gòu)建索引的示例
bwa index mm10.fasta
├── mm10.fasta
├── mm10.fasta.amb
├── mm10.fasta.ann
├── mm10.fasta.bwt
├── mm10.fasta.pac
└── mm10.fastq.sa
建立好參考基因組之后,就可以進行比對了。不同的比對算法,命令不同。
對應(yīng)的子命令為aln/samse/sample
單端數(shù)據(jù)用法如下:
bwa aln ref.fa reads.fq > aln_sa.sai
bwa samse ref.fa aln_sa.sai reads.fq > aln-se.sam
雙端數(shù)據(jù)用法如下:
bwa aln ref.fa read1.fq > aln1_sa.sai
bwa aln ref.fa read2.fq > aln2_sa.sai
bwa sampe ref.fa aln_sa1.sai aln_sa2.sai read1.fq read2.fq > aln-pe.sam
對應(yīng)的子命令為bwasw
, 基本用法如下
bwa bwasw ref.fa reads.fq > aln-se.sam
bwa bwasw ref.fa read1.fq read2.fq > aln-pe.sam
對應(yīng)的子命令為mem
, 基本用法如下
bwa mem ref.fa reads.fq > aln-se.sam
bwa mem ref.fa read1.fq read2.fq > aln-pe.sam
對于超長讀長的reads,比如PacBio和Nanopore測序儀產(chǎn)生的reads, 用法如下
bwa mem -x pacbio ref.fa reads.fq > aln.sam
bwa mem -x ont2d ref.fa reads.fq > aln.sam
上述的代碼中, ref.fa
指的是參考基因組索引的名字,對于上面提供的小鼠的例子而言,參考基因組索引的名字為mm10.fasta
, 注意是不包含后綴的。
默認用法都非常簡單,有時還需要對參數(shù)進行調(diào)整,以mem
子命令為例,常用的參數(shù)包括以下幾個:
-t
指定線程數(shù),默認為1,增加線程數(shù),會減少運行時間;-p
忽略第二個輸入序列,默認情況下,輸入一個序列文件認為是單端測序,輸入兩個序列文件則是雙端測序,加上這個參數(shù)后,會忽略第二個輸入序列文件,把第一個文件當做單端測序的數(shù)據(jù)進行比對;-Y
參數(shù)對數(shù)據(jù)進行soft clipping
, 當錯配或者gap數(shù)過多比對不上時,會對序列進行切除,這里的切除并只是在比對時去掉這部分序列,最終輸出結(jié)果中序列還是存在的,所以稱為soft clipping
。
看完上述內(nèi)容,你們掌握bwa軟件用法是怎樣的的方法了嗎?如果還想學(xué)到更多技能或想了解更多相關(guān)內(nèi)容,歡迎關(guān)注創(chuàng)新互聯(lián)行業(yè)資訊頻道,感謝各位的閱讀!
文章標題:bwa軟件用法是怎樣的
瀏覽地址:http://m.rwnh.cn/article14/jepege.html
成都網(wǎng)站建設(shè)公司_創(chuàng)新互聯(lián),為您提供品牌網(wǎng)站設(shè)計、小程序開發(fā)、品牌網(wǎng)站制作、微信公眾號、自適應(yīng)網(wǎng)站、網(wǎng)站內(nèi)鏈
聲明:本網(wǎng)站發(fā)布的內(nèi)容(圖片、視頻和文字)以用戶投稿、用戶轉(zhuǎn)載內(nèi)容為主,如果涉及侵權(quán)請盡快告知,我們將會在第一時間刪除。文章觀點不代表本網(wǎng)站立場,如需處理請聯(lián)系客服。電話:028-86922220;郵箱:631063699@qq.com。內(nèi)容未經(jīng)允許不得轉(zhuǎn)載,或轉(zhuǎn)載時需注明來源: 創(chuàng)新互聯(lián)