生物信息SSH命令一
想要备份下在基因组所能用到的shell命令,包括日常科研和数据分析中应用到的工具,都会在这个系列中列出,不会涉及到机密性问题吧。。
同时真心希望Javaeye能够建立一个生物信息专栏,毕竟很多生物信息方面的从业者都是从计算机过来的,很多生物信息方向的学生都是Javaeye的忠实观众,很多bioinformatics的问题都是用Java和Python或者Perl解决的,这和Javaeye的关注是相同的。希望生物信息人能够在Javaeye找到属于自己的天地。I love Javaeye!
一:1:mkdirmmkdir chromat_dirmkdir edit_dir2:phred –id chromat_dir –pd phd_dir -trim_cutoff 0.05 -trim_phd -trim_alt ""3:phd2fasta –id phd_dir –os edit_dir/1609.seq –oq edit_dir/1609.seq.qual4:phrap 1227.seq –view –new_ace >1609.out 5:formatdb -p F -o T -i Artemia_franciscana.txt -n Arte.db blastall -p blastn -d Arte.db -i 1610.seq.contigs -o 1610.blast perl EblastN.pl -i 1610.blast –o 1610.xls -e 0.001 -l 100 phred -id ../chromat_dir/ -pd phd_dir/ -trim_cutoff 0.05 -trim_phd -trim_alt "" 二:finishingphred -id chromat_dir -pd phd_dir -trim_alt "" -trim_phdphd2fasta -id phd_dir -os edit_dir/1609.seq -oq edit_dir/1609.seq.qualcross_match mouse.seq pGMT.seq -screen >mouse.screen.outphrap 1609.seq.screen –view –new_ace –revise_greedy >1609.out 三:恢复与E.coli同源的序列mv wheat2.seq.qual wheat2.seq.screen.qualphrap wheat2.seq.screen -new_ace > phrap.outperl determine---.pl 四:预测ORF命令lslong-orfs Contig70.fasta > longorf_out打开文件longorf_out,去掉开头几行extract Contig70.fasta longorf_out >train.seqbuild-icm <train.seq >train.modelglimmer2 Contig70.fasta train.model > orf_list打开文件orf_list,去掉putative gene 之前的东西extract Contig70.fasta orf_list >orf_seqperl ../../../perl/process_glimmer.pl -i orf_seq -n nuc70.seq -p pro70.seq将orf.seq转换成fasta格式 五:formatdb -p F -o T -i wheat3.seq.screen.contigs -n wheat3contig.dbblastall -p blastn -d wheat3contig.db -i wprobesequences -o out3.blastperl ../../perl/EblastN.pl -i out4.blast -o out4.xls -e 0.001 -l 100(overlap) 六:RepeatMasker –species human –no_is seq.fa(需要除重复的序列)