
SOAPnuke是华大自主开发的一款针对fastq文件的过滤软件,主要功能有adapter过滤、低quality过滤和高比例N过滤。基本的过滤功能集中在filter模块中,filter模块适用于大部分fastq格式下机数据过滤。针对特定数据类型的处理,可以使用filtersRNA、filterDGE或filterMeta模块。
测序平台:HiSeq 2000,HiSeq 2500,HiSeq 4000, HiSeq X Ten, Zebra
测序策略:PE/SE
数据类型:
filter:过滤RNA-seq、RNA-ref、BS、MeDIP、CHIP、RNAdenovo以及DNA测序产生的下机fastq原始数据。
filtersRNA:短序列SE测序的小RNA(成熟长度一般在21 23个nt左右,tag的长度在18 30个nt),同样试用于小RNA降解组流程。
filterDGE:本文不作详细说明
filterMeta:本文不作详细说明
1)去除含有adapter的reads(去除) (一个错配,比对比例)或者截掉reads中的adapter序列
2)去除质量值小于10(5 )的碱基占超渗大散过整条reads碱基数50%
3)去除N的比例大于5%(默认)的reads
4)去除poly A(RNA)(都是A的序列 100%)
5)去除index (序列ID中)
6)截取指定数据量
7)输出clean data和raw data (截取数据的情况下才会输出raw data)
8)去除平均质量值过低的reads
9)去除来自PCR重复片断的reads
10)去除插入片断长度过小的reads (read1和read2的overlap >=10bp, mismatch <=10%),针对DNAdenovo 默认不做
11)fastq文件质量质量体系转换
SOAPnuke filter [OPTION]…
the next two options only for adapter sequence:
the next two options only for filter the small insert size
SOAPnuke filtersRNA
2015/11/11 lishengkang@genomics.cn :升级至1.5.3版本,新版本增加了
–cutAdaptor 参数,选择此参数后,SOAPnuke会截掉reads中的接头序列,而不是直接丢弃含有接头的reads。截短后的reads长度要求至少INT bp,否则整个reads丢弃。
增加了–BaseNum参数,此参数的值是截取数据所需要保留的数据量,只有仿扒在选择了–cutAdaptor的情况下能生效。
选择–cutAdaptor后,同样是丛氏截取数据功能的–cut参数失效。本版本开始–adapter1和–adapter2的值只能是接头序列,不再对adapter list进行支持。
https://weibo.com/p/1001603908643614550165
对网络通信行为进行监控并对数据包进行过滤的应用程序是网络数据包分析器(Network Packet Analyzer),也被称为协议分析器(Protocol Analyzer)或网络分析器(Network Analyzer)。网络数据包分析器是一种特殊的软件工具,可以截获和分析在计算机网络中传输的数据包,它可以深入分析数据包的头部和负载,并可以根据用户定义的规则过滤、捕获或拦截网络数据包,以便进行诊断、性能优化、安全审计等方面的工作。
常见的网络数据包分析器包括Wireshark、tcpdump、Snort等。这些工具提供了丰富的功能,例如流量分橡御析、协议分析、数据包捕获、错误检测、注入攻击检测等,并可通物樱过可视化界面展示捕获到的信息,方罩如丛便用户进行 *** 作和分析。
欢迎分享,转载请注明来源:内存溢出
微信扫一扫
支付宝扫一扫
评论列表(0条)