写在前面

  1. 植物miRNA与动物miRNA在多种特征上存在区别,所以直接使用miRDeep或miRDeep-2去分析植物miRNA数据是非常不负责任的。
  2. miRDeep-P2是de novo预测,不是通过同源序列匹配
  3. 得到的结果需要依据已有的miRNA家族命名,获得的新的miRNA家族也需要命名,这部分分析代码并不包含在miRDeep-P2中
  4. 关于miRDeep-P2及miRNA的问题欢迎交流qq:734256624

软件下载地址:https://sourceforge.net/projects/mirdp2/files/,推荐下载最新版

参数
NECESSARY:
-g/–genome reference genome file in fasta format
-x/–index /prefix bowtie index file corresponding to reference genome(是bowtie的index,不是bowtie2)
-f/–fasta formatted sRNA-seq file in fasta format
-q/–fastq unformatted sRNA-seq file in fastq
-i/–input input file(s), multiple files are seperated by comma (,)
-b/–batch list file of input files
-o/–output path to output folder (输出文件夹路径最后不要加斜线"/",输出文件夹需要自己提前构建)

OPTIONAL:
-L/–locate THRESHOLD of different locations one read can map to, default is 15 (个人认为,如果是4倍体,这里的参数可以设置为30试一试)
-N/–length THRESHOLD of length of precursor candidates, default is 300 (根据目前的植物miRNA标准,这里不建议修改)
-M/–mismatch THRESHOLD of allowed mismatches for bowtie mapping, default is 0
-R/–rpm THRESHOLD of reads rpm when filtering, default is 10 (这里可以适当放低,RPM为5也是可以接受的)
-p/–thread number of thread used for RNAfold, default is 1
–large-index use this option when using large bowtie index, e.g. when using *.ebtwl files (如果基因组很大,bowtie构建的index后缀为 ebtwl,则需要加上 --large-index参数)
-h/–help print this help

示例:

  1. 构建bowtie index(不是bowtie2)
    bowtie genome.fasta genome.index
    
  2. 运行miRDeep-P2
    i. 如果基因组不大,则可以看到bowtie构建的index后缀为ebtw,不需要加–large-index参数;如果index后缀为ebtwl,则需要加上–large-index参数。
    ii. 输出文件夹需要提前构建
    iii. -o后加的输出文件夹最后不要加斜线"/"
    mkdir miRDP2_out
    miRDP2-v1.1.4_pipeline.bash -g genome.fasta -x genome.index -q -i sRNA-seq_trimmed.fq -o miRDP2_out -R 5
    
    输出文件夹中后缀为P_prediction的文件为miRNA的信息文件
Logo

DAMO开发者矩阵,由阿里巴巴达摩院和中国互联网协会联合发起,致力于探讨最前沿的技术趋势与应用成果,搭建高质量的交流与分享平台,推动技术创新与产业应用链接,围绕“人工智能与新型计算”构建开放共享的开发者生态。

更多推荐