基因与医疗和健康

 找回密码
 立即注册

扫一扫,访问微社区


这是面向专业人士的交流平台,以基因科技发展及其转化应用为核心,连接上下游相关方,倡导有序交流和知识共享,沉淀精华,增进相互了解与互信,提高科技转化应用效率,推动生命科学相关行业的发展。本论坛定位于专业人员交流,不做患者和公众咨询。

查看: 2362|回复: 1

遗传病测序数据分析解读科普系列 第1期 解读知识篇概述

[复制链接]

31

主题

23

帖子

357

积分

版主

Rank: 7Rank: 7Rank: 7

积分
357
发表于 2018-6-24 13:19 | 显示全部楼层 |阅读模式
本帖最后由 孙继国 于 2018-6-24 13:18 编辑

一、背景介绍
数据解读的目的
二代测序作为研究人类遗传学的重要工具之一,已经广泛应用于临床与科研领域,其优势是对人类基因组序列覆盖能力显著增加,但同时带来一个严峻挑战是庞大的数据量,如何从海里数据中分析出与样本表型直接相关的变异,是数据解读的目的。
图片1.jpg
图片2.jpg

数据解读的过程
数据解读需要做的:
从变异数据文件中发现与表型直接相关的变异

其过程主要包括:
1、变异注释
2、变异过滤
3、表型相关性分析
4、证据链分析


二、本期目的
本期文章的目的是概括性描述数据解读的过程,让读者先了解数据解读的主要流程,随后的系列文章中会详细介绍流程中每个环节。


三、解读流程概述
变异注释
变异注释的目的:
赋予变异数据(通常为vcf文件)必要的信息,主要包括变异对基因组功能的影响(如xx基因发生错义,移码等变异),危害性预测(如sift软件预测)及相应数据库信息的提取(如OMIM或ExAC数据库的对应信息)
参考软件有:annovar,vep,vaast等
图片3.jpg

变异过滤
变异过滤的目的:
根据注释数据的信息,通过一定的原则,筛选出可能有害的变异(如去除同义突变,保留对照人群基因型频率<0.05的位点等),作为表型相关性分析的候选变异。
参考软件有:annovar,vaast,Gemini等
图片4.jpg

表型相关性分析
表型相关性分析的目的:
在候选变异中找到与样本表型有相关性的部分,如变异所在基因对应的已知疾病或功能是否与表型相关,遗传模式是否符合等。
参考软件有:phenomizer,phenolyzer,findzebra等
注:部分表型相关性分析工具并不考虑变异信息,只针对表型与基因的对应关系
图片5.jpg

证据链分析
证据链分析的目的:
通过参考相应指南的证据链框架,提供解读结果相应的分析证据,赋予结果可解释性。
参考指南及软件:ACMG变异分类指南,sherloc变异分类指南,clingen基因疾病关系指南,intervar等
注:感谢顾老师邀请,sherloc变异分类指南会单独出一期文章介绍
图片6.jpg


四、需要注意的问题
以上描述的数据解读的过程有个隐性前提:
表型相关变异存在于变异数据中

因此,以上流程基于一个理想状态,但现实情况是:
孟德尔遗传病分析总体检出率<50%

所以,很多样本即使穷尽分析手段,也依然会是阴性结果。
关于变异数据文件的生成和孟德尔遗传病分析检出率的相关内容会在之后的系列中讲述。


五、结束语
数据解读是个复杂且尚未成熟的过程,会随着时间推移不断发展提高,作者总结的流程中难免存在错误,偏向性或遗漏的地方。如果有读者觉得有错误或者需要补充的内容,欢迎指出。希望能通过和大家的沟通共同进步。





上一篇:遗传病测序数据分析解读科普系列 第0期 开场白
下一篇:遗传病测序数据分析解读科普系列 第1.1期 解读必要数据...

1

主题

12

帖子

429

积分

金牌会员

Rank: 6Rank: 6

积分
429

金牌特邀

发表于 2019-11-6 17:32 | 显示全部楼层
这篇真的很实用,尤其是做科普的时候,这几张图特别的简单易懂
您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

Archiver|手机版|小黑屋| ( 京ICP备18008006号-2

免责声明:用户发帖仅代表个人意见,不代表本论坛立场。 GMT+8, 2019-12-6 11:02

Powered by 顾大夫®工作室  技术支持:北京众易科技

© 2018 基因与医疗和健康

快速回复 返回顶部 返回列表