基因组注释软件 注释 变异序列的数字是什么意思

 上传我的文档
 下载
 收藏
该文档贡献者很忙,什么也没留下。
 下载此文档
正在努力加载中...
人类基因组indel与结构变异的检测和分析方法的研究(1)
下载积分:900
内容提示:人类基因组indel与结构变异的检测和分析方法的研究(1)
文档格式:PDF|
浏览次数:145|
上传日期: 18:25:41|
文档星级:
该用户还上传了这些文档
人类基因组indel与结构变异的检测和分析方法的研究(1)
官方公共微信世界首例人体基因组序列公布 DNA变异比之前要多肿瘤用药基因检测
肿瘤遗传易感基因检测
转录调控测序
动植物基因组测序
微生物基因组测序
人类基因组测序
市场与支持
北京诺禾致源科技股份有限公司于2011年3月在北京中关村生命科学园注册成立,专注于开拓前沿分子生物学技术和高性能计算在生命科学研究和人类健康领域的应用,致力于成为全球领先的基因组学产品和服务提供者。企业总部位于北京,在天津、南京、美国和新加坡设有实验室或实验基地,并在香港、美国和英国设有子公司,办公面积逾26'000m2。
与参考基因组比对
比对率、测序深度、覆盖度分析
样本比对率,指比对到参考基因组上的reads数目除以有效测序数据的reads数据,反映了样本测序数据与参考基因组的相似性。测序深度,指比对到参考基因组的碱基总数除以基因组大小;覆盖度,指被测到的该物种基因组的碱基总数占该物种基因组长度的百分比;测序深度和覆盖度能够直接反应测序数据的均一性及与参考序列的同源性。
测序深度及覆盖度统计
Mapped reads
Total reads
Mapping Rate (%)
Average depth (×)
Coverage at least 1 or 4 × (%)
33,715,993
34,903,794
97.33 or 94.11
67,686,930
69,676,436
98.77 or 95.24
SNP检测及注释
开发SNP标记并进行注释
SNP(单核苷酸多态性)主要是指在基因组水平上由单个核苷酸的变异所引起的DNA序列多态性,包括单个碱基的转换、颠换等。我们采用SAMTOOLS等软件进行个体SNP的检测。为了降低SNP检测的错误率,选用如下标准进行过滤:(1) SNP的reads支持数不低于4;(2) SNP的质量值(MQ)不低于20。
SNP检测及注释结果统计
ANNOVAR是一种高效的软件工具,它能利用最新的信息,对由多个基因组检测出的基因变异进行功能注释。鉴于ANNOVAR强大的注释功能和国际的认可性,我们利用它对SNP检测结果进行注释。
SNP检测及注释结果统计
Number of SNPs
Synonymous
Non-synonymous
Downstream
upstream/downstream
SNP检测质量分布
单个样本构建染色体跨度单体型
为了确保样本SNP的可信性,对样本检测的SNP的reads支持数,质量值(QUAL)和相邻SNP的距离统计累积分布。
SNP突变频谱
全基因组SNP突变可以分成6类。以T:A>C:G为例,此种类型SNP突变包括T>C和A>G。由于测序数据既可比对到参考基因组的正链,也可比对到参考基因组的负链,当T>C类型突变出现在参考基因组正链上,A>G类型突变即在参考基因组负链的相同位置,所以将T>C和A>G划分成一类。
InDel检测及注释
InDel是指基因组中小片段的插入和缺失序列。利用SAMTOOLs检测长度小于50bp的小片段插入与缺失(InDel),然后用ANNOVAR软件对检测出的InDel进行注释。
InDel检测及注释结果统计
Frameshift deletion
Frameshift insertion
Non-frameshift deletion
Non-frameshift insertion
Downstream
Upstream/Downstream
Intergenic
Het rate(‰)
SV检测及注释
SV(结构变异)指基因组水平上大片段的插入、缺失、倒置、易位等序列。可利用BreakDancer软件,进行插入、缺失、倒置、染色体内部迁移、染色体间的迁移的检测,然后利用ANNOVAR进行变异注释。为保证结果的可靠性过滤去掉PE reads支持数小于2的SV结果。
SV检测及注释结果统计
Upstream1561,266
Exonic3392,455
Downstream1101,023
Intronic123889
Upstream/Downstream27189
Intergenic1,1958,915
Splicing06
INS6322,022
DEL1,14011,500
INV1781,221
ITX1901,097
CTX1,3177,286
Total3,45723,126
CNV检测及注释
CNV(拷贝数变异)指基因组片段的拷贝数增加或者减少。可通过CNVnator进行检测,即通过基因组上不同的reads 覆盖深度,判断潜在的拷贝数增加和拷贝数减少,并通过ANNOVAR进行变异注释。
SV检测及注释结果统计
Upstream107240
Exonic4221,421
Intronic2468
Downstream53182
Upstream/Downstream1761
Intergenic1,1243,210
Duplication number5521,522
Deletion number1,1953,660
Duplication length(bp)5,267,10018,373,100
Deletion length(bp)16,177,80046,817,400
Total1,7475,182
基因组结构变异展示
为了形象化展示样本中的结构变异,对数据做如下处理:1. 对于SNP和InDel,画出其在染色体上的密度分布;2. 对于SV及CNV,画出它们在染色体上的位置及大小。君,已阅读到文档的结尾了呢~~
第五章基因组序列注释
扫扫二维码,随身浏览文档
手机或平板扫扫即可继续访问
第五章基因组序列注释
举报该文档为侵权文档。
举报该文档含有违规或不良信息。
反馈该文档无法正常浏览。
举报该文档为重复文档。
推荐理由:
将文档分享至:
分享完整地址
文档地址:
粘贴到BBS或博客
flash地址:
支持嵌入FLASH地址的网站使用
html代码:
&embed src='/DocinViewer--144.swf' width='100%' height='600' type=application/x-shockwave-flash ALLOWFULLSCREEN='true' ALLOWSCRIPTACCESS='always'&&/embed&
450px*300px480px*400px650px*490px
支持嵌入HTML代码的网站使用
您的内容已经提交成功
您所提交的内容需要审核后才能发布,请您等待!
3秒自动关闭窗口

我要回帖

更多关于 细菌基因组注释 的文章

 

随机推荐