论文类
哈佛大学
一号,
广度学院
2,
波士顿儿童医院
3,
华盛顿大学
4,
亚利桑那大学
5,
卡地夫大学
6,
谷歌
7,
Icahn西奈山医学院
8,
三星医疗中心
九九,
顶点药厂
10,
密歇根大学
11,
剑桥大学
12,
纽约州立大学前台医科大学
13,
卡洛林斯卡学院
14,
东芬兰大学
15,
Wellcome人类遗传学信托中心
16,
牛津大学
17,
西奈医疗中心
18号,
渥太华大学
19号,
宾夕法尼亚大学
20码,
北卡罗来纳大学
21号,
赫尔辛基大学
22号,
加利福尼亚大学圣地亚哥
23号,
密西西比大学医疗中心
24码
TL;DR:集合分析60 706名个人高品质Exome聚合库脱氧核糖核酸序列数据,直接证明广度突变复发
抽象性 :大规模参考数据集人类基因变异对DNA序列变换的医学和功能解释至关重要在此描述60 706位个人高质量Exome聚合式脱氧核糖核酸序列数据汇总分析人类遗传多样性目录平均包含八分之一基数,并直接证明广度突变复发并识别各种变异类型需严格选择的基因3 230基因接近完全耗尽预测蛋白调试变异,72%的基因目前没有确定人类病pheno类型必威体育BW最后,我们证明这些数据可用于高效过滤候选致病变异物,并用于发现蛋白质编码基因中的人体'knockout'变异
8758引用
TL;DR:125 748全外位和15 708全位排序数据集预测功能变异目录显示变异约束频谱影响这些人类蛋白编码基因
抽象性 :基因变异即非激活蛋白编码基因强源了解基因打乱的情结:对机体功能至关紧要的基因将在自然群中耗尽这些变异,而非基本基因则容容积这些变异预测功能损失变异因注解错误而增益,并往往发现极低频率,所以分析需要仔细变换注解和大采样大小1共125 748异形和15 708基因组从人类排序研究输入基因组聚合数据库发现443 769高可靠性预测函数变异必威体育BW使用改良型人变速率模型, 人类蛋白编码基因分布谱表示耐失作用性, 使用模型生物和人工人体细胞数据验证分类并显示它可用于提高常见和稀有疾病的基因发现能力125 748全外位和15 708全位排序数据集预测功能变异目录显示变异约束频谱影响这些人类蛋白编码基因
4913引用
TL;DR:betway亚洲脱氧核糖核酸元素百科全书项目为作者基因和基因组的组织和规范提供新洞察力,也是生物医学研究功能注解广度资源
2 767引用
斯坦福大学
一号
TL;DR:创新方法数据库RegulomeDB指导人类基因组调控变量解释,其中包括高通量、ENCODE实验数据集和其他来源,以及计算预测和人工注解以确定假设调控潜力和功能变量
抽象性 :健康和疾病基因组排序越发常见,详细注解为正常型和病型个体变换提供解释当前方法侧重于蛋白编码基因的直接变化,特别是非同义变异直接影响到基因产品然而,大多数个体变异都发生在基因外,事实上,从全基因组关联研究中生成的大多数标识识别编码段外变量识别可能干扰这些网站的监管变化,导致真正功能变异的更好定位并解释其效果并开发出新式方法数据库RegulomeDB 指导人类基因组管理变异解释RegulomeDB包括高通量实验数据集ENCODE和其他来源,以及计算预测和人工注解以确定推定监管潜力并识别功能变异数据源合并成强工具分数变量帮助从大池分离功能变量,并提供小组可测试假设网站功能显示该工具可适用于69全序基因组非编码变异说明 以及个人基因组非编码变异说明此外,我们展示GWAS数据库快速识别已知相关功能变异并提供函数假设整体上,我们期望这一方法和资源对描述人类基因组序列有价值
2 355引用
TL;DR:集合分析60 706名多民族个人高质量Exome聚合库提供直接证据证明广泛突变复发
抽象性 :大规模参考数据集人类基因变异对DNA序列变换的医学和功能解释至关重要描述60 706名多民族个人高质量Exome(蛋白编码区域)序列数据汇总分析生成的人类遗传多样性目录有史无前例的解析法,平均8基编码数和广度突变复发Exome聚合财团提供的深度变异目录可用于计算序列变异的致病性客观度量值,并识别受各种变异强选择的基因3 230基因几乎完全耗竭脱轨变异体,其中79%目前没有确定人类病pheno类型必威体育BW最后,我们显示这些数据可用于高效过滤候选致病变异体,并用于发现蛋白质编码基因中的人类击退变异
1 552引用
引用
TL;DR:betway亚洲脱氧核糖核酸元素百科全书项目为作者基因和基因组的组织和规范提供新洞察力,也是生物医学研究功能注解广度资源
抽象性 :人类基因组编码生命蓝图, 但其近30亿基数的绝大多数函数并不知道脱氧核糖核酸元素百科全书项目系统绘制转录区图、转录因子关联区图、染色体结构区图和直方字修改区图这些数据使我们能够分配80%基因组生物化学函数, 特别是在研究周密蛋白编码区域外必威体育BW发现的许多候选调控元素与表达式基因有物理关联,为基因调控机制提供新洞察力新识别元素还显示与人类疾病关联序列变异的统计对应性,从而可引导解释该变异betway亚洲整体而言,项目为生物医学研究提供新洞察力并规范我们的基因和基因组,并广度函数注解资源
13 548引用
[.]
TL;DR:提议基于负二分分布法并因局部回归而产生差值和均值联系,并提交R/Bio导体包实施Deseq
抽象性 :高通量排序解析,如RNA-Seq、ChIP-Seq或条码计数以计数数据形式提供量化读出如果要正确推断数据差分信号并拥有良好的统计能力,则需要估计全动态范围的数据变异性并使用合适的误差模型基于负二分分布法和偏差均值连接本地回归法,并用R/Bio导体打包
13356引用
[.]
TL;DR:测试显示HISAT系统是目前最快可用系统,比任何其他方法精度相同或更高,只需要4.3千兆字节内存
抽象性 :HISAT分层编译记录集系统高效校准RNA排序实验读数HISAT使用基于Burrows-Wheeler变换和Ferragina-Manzini索引的索引化方法,使用两种索引对齐:全元调频索引定位对齐和多项本地调频索引快速扩展这些对齐HISAT人类基因组层次索引包含48,000本地调频索引,实模数据集测试显示HISAT是目前最快可用系统,比任何其他方法精度相同或更高HISAT尽管数量庞大,但只需要4.3千兆字节内存HISAT支持各种大小的基因组,包括大于40亿基数的基因组
13 192引用
[.]
TL;DR:千基因组项目综合描述人类常见基因变异,对多群化个体应用全基因变序,并使用低覆盖全代序列、深异组序列和稠密微数组组合重构26个群2 504人的基因组
抽象性 :千基因组项目综合描述人类常见基因变异,对多群化的多元化个人群应用全基因序列重构26组2 504人的基因组 使用低覆盖全基因排序 深片测序 稠密微数组演算八千八百多万变异物(8 470万单核多态化物(SNPssssssssssssssssssssssss)360万短插入/删除(indelssssssssssssss)和60万结构变异物sssse资源中包含>99%sNP变异,频率为>1%我们描述基因变异分布全局样本 并讨论对常见疾病研究的影响
12 661引用
TL;DR:TopHat2描述,它包含对TopHat的许多重大增强作用,并结合识别新点和直接映射已知笔录的能力,生成敏感和精确对齐,即使是高重复基因组或伪基因存在时也是如此
抽象性 :TopHat为RNA序列实验常用复制编译器本文描述TopHat2中包含对TopHat多项重大增强TopHat2可校准由最新排序技术生成的不同长度,同时允许参考基因组可变长英格除新相联对齐外,TopHat2可对齐分解码TopHat2组合能力识别新样网站并直接映射已知笔录,生成敏感和精确对齐,即使是高重复基因组或伪基因存在时也是如此TopHat2网站http://ccb.jhu.edu/software/tophat
11 380引用