RNA-seq :TopHat2 + Cufflinks分析流程 (转帖)

RNA-seq :TopHat2 + Cufflinks分析流程: 1、测序数据质量控制:fastqc软件 1)使用方法:/life/rjian/software/fastQC/FastQC/fastqc -o /life/rjian/data/liyan/filename_fastqc \filename.fq >>filename.log 2)参数说明:-o:输出文件所在目录,并且是已经存在的目录,如:filename_fastqc –noextract:不解压缩输出文件 最后加上fastq文件:filename.fq;重定向结果到日志文件:filename.log,以便查看。 filename:表示是一个样品的一个生物学重复,一般有多个样品,每个样品有多个重复,如:C1_R1; 如果是双端测序则后面会加上数字,如:filename_1.fq和filename_2.fq

2、reads trim工具——trimmomatic 1)使用方法:java -jar /life/rjian/software/Trimmomatic-0.32/trimmomatic-0.32.jar SE -threads 5 \-phred33 -trimlog filename_trimmomatic.log filename.fq filename_out.fq ILLUMINACLIP:adapter.fa:2:30:10 \SLIDINGWINDOW:4:15 MINLEN:36 2)参数说明:SE:指定单端测序,PE:双端测序 -threads:指定线程数 -phred33:指定fastq文件的质量格式,或者:-phred64 -trimlog:指定日志文件,后加上输入和输出文件 ILLUMINACLIP:adapter.fa:2:30:10 :adapter.fa为adapter文件,2:允许的最大mismatch 数,30:palindrome模式下匹配碱基数阈值,10:simple模式下的匹配碱基数阈值 SLIDINGWINDOW:4:15 MINLEN:36 :滑动窗口的size是4个碱基,其平均碱基质量小于15,则切除。 MINLEN:36 :最低reads长度为36 3、bowtie2建立参考基因组的索引——bowtie2-build 1)使用方法: bowtie2-build <要生成的索引文件前缀名>;比如: nohup /home/cuckoo/software/bowtie2-2.2.3/bowtie2-build genome.fa bowtie2index/genome>>bowtie2.log & 2)参数说明:genome.fa是fasta文件; […]