時間:2019-09-20 11:49:57 作者:無名 瀏覽量:63
今天小編就為大家?guī)砘A工具Clustalx的使用方法。CLUSTALX-是CLUSTAL多重序列比對程序的Windows版本。
Clustal是一種利用漸近法(progressive alignment)進行多條序列比對的軟件。即先將多個序列兩兩比較構(gòu)建距離矩陣,反應序列之間兩兩關(guān)系;然后根據(jù)距離矩陣計算產(chǎn)生系統(tǒng)進化指導樹;然后從多條序列中最相似(距離近期)的兩條序列開始比對,按照各個序列在引導樹上的位置,由近及遠的逐步引入其它序列重新構(gòu)建比對,直到所有序列都被加入形成最終的比對結(jié)果為止(Figure 1)。
clustal 算法:
Clustal軟件有兩個版本,其中clustalw采用命令行的形式在DOS/Linux下運行的, Clustalx是可視化界面的程序,可在window電腦運行,我們今天學習Clustalx的使用。
1 安裝clustalx:
下載clustalx軟件,按照默認安裝到自己的電腦上。
2 準備要比對的序列:
將上節(jié)課搜索到的同源核酸fasta文件,全部粘貼到一個文本文件中,所有的蛋白質(zhì)序列存入另一個文本文件。
基礎工具Clustalx的使用方法圖二
3 載入序列:
點擊開始-程序-clustalX2-clustalX2。
點主菜單File,選擇Load Sequence-選擇剛保存的序列文件,點打開。
注意:ClustalX程序無法識別漢字、帶空位的文件夾名,如my document。
載入序列后在左側(cè)窗口里是fasta格式序列的標識號,取自序列第一行“>”后的字符。
4 比對參數(shù)的設置:
比對前先要設置兩條序列比對的參數(shù)和多條序列比對的參數(shù)。
a.兩條序列比對的參數(shù)
點擊Alilgnment菜單,選擇Alignment Parameters,再選擇Pairwise Alignment Parameters,如Figure 3,首先可以選擇比對的效果,是slow/accurate 還是fast/approximate。第一種模式采用的是動態(tài)規(guī)劃算法進行比對的,第二種模式采用的是啟發(fā)式的算法。除非序列非常長,一般采用第一種模式?梢赃x擇空位罰分系統(tǒng),DNA或蛋白質(zhì)替換矩陣,也可以自己上傳某個替換矩陣進行比對。
b.多條序列比對參數(shù)
點擊Alilgnment菜單,選擇Alignment Parameters,再選擇Multiple Alignment Parameters,如Figure4.
Delay divergent sequence是指當兩條序列的差異大于某個值(百分比)時,這兩條序列的比對將推遲進行,程序先比對相似序列,對于相似度不夠高的序列,晚些時候進行比對,加入到最終的多條序列比對結(jié)果時也要遲些。DNA transition Weight等于0的時候,程序?qū)⑥D(zhuǎn)換當作錯配(mismatch)看待,等于1的時候,將轉(zhuǎn)換和匹配同等看待。當參與比對的序列差異較大時,DNA transition Weight應該選擇的小些(接近0),如果參與比對的序列差異較小時,DNA transition Weight可選擇的大些(接近1)。
基礎工具Clustalx的使用方法圖三
5 設置輸出格式:
點擊Alignment菜單,選擇Output Format Options,頁面如Figure 5。
默認的是輸出clustal format,如果需要其它格式,可在復選框里打勾。如PHYLIP格式是利用PHYLIP軟件進行建樹時,需要輸入的格式
6 進行比對:
點擊Alignment菜單,選擇Do Complete Alignment.此時出現(xiàn)一個對話框,提示比對結(jié)果保存的位置,上一步選擇了多少種輸出格式,這里就需要給出多少個文件的路徑。選擇好了點OK即可。