差异可变剪接分析工具rMATS

可变剪接(Alternativesplicing;又称“选择性剪接”)是一种在真核生物中非常普遍的基因表达方式,具体表现为一个基因的外显子以不同的组合方式剪接形成不同的成熟RNA,从而在不同的时空环境和状态下形成不同的蛋白质,执行不同的生物学功能。目前许多可变剪接分析软件主要可鉴别5种不同的可变剪接事件,分别为外显子跳跃(skippedexon,SE),5’可变剪切位点(alternative5′splicesite,A5SS),3’可变剪切位点(alternative3′splicesite,A3SS),互斥外显子(mutuallyexclusiveexons,MXE)和内含子保留(retainedintron,RI),图示如下:

rMATS是一款利用RNA-Seq数据分析差异可变剪接的工具,它在MATS(multivariateanalysisoftranscriptsplicing)的基础上针对有生物学重复的情况提出了新的统计模型。模型根据reads比对到不同转录本(是否包含选择性剪接的外显子)的比例来定义剪接位点的inclusionlevel,并用likelihood-ratiotest检验不同组中生物学重复的平均inclusionlevel的差异显著性来判定差异可变剪接。

软件安装

安装软件之前首先确认已安装Python2.7.x及所需模块(NumPy,BLAS,LAPACK,GSLandgfortran),在Python控制台输入以下命令检查编码类型:

importsysprintsys.maxunicode

根据编码类型的不同,选择使用不同版本的rMATS:

输出结果为时,选择rMATS-turbo-xxx-UCS4;

输出结果为时,选择rMATS-turbo-xxx-UCS2。

从下面的网址下载rMATS并解压,根据需要选择安装STAR及获取基因组的STAR索引文件。




转载请注明:http://www.aierlanlan.com/cyrz/4953.html