(一)
genome-wide association meta-analysis in 269,867 individuals identifies new genetic and functional links to intelligence
对269867个个体的全基因组关联荟萃分析鉴定出与智力相关的新的遗传和功能连锁位点
智力是高度遗传并且决定人类健康与幸福感的主要因素之一。最近的全基因组荟萃分析已经确定了24个与智力变异相关的基因座,但其遗传基础仍有待发现。在这里,研究者展示了一项大规模的智力遗传关联研究(n=269867),通过位置作图、表达数量性状位点(eqtl)作图、染色质相互作用作图和基于基因的关联分析,鉴定出205个相关基因组位点(190个新位点)和1016个基因(939个新基因)。研究者发现在保守区和编码区的遗传效应富集,与146个非同义外显子变异关联。相关基因在大脑中强烈表达,特别是纹状体中棘神经元和海马锥体神经元。对基因集的分析揭示了与神经系统发育和突触结构途径有关。本研究证实了先前与多种健康相关结果的强遗传关联,孟德尔随机化分析结果表明,智力对阿尔茨海默病和adhd有保护作用,对精神分裂症有双向因果关系的多效性作用。这些结果在理解认知功能的神经生物学以及遗传相关的神经和精神疾病方面向前迈出的重要一步。
(二)
meta-analysis of genome-wide association studies for neuroticism in 449,484 individuals identifies novel genetic loci and pathways
对449484个神经过敏症个体的全基因组关联研究的荟萃分析确定了新的遗传位点和途径
神经过敏症是精神类性状的重要危险因素,包括抑郁、焦虑和精神分裂症。在分析时,先前的全基因组关联研究(gwas)报告了16个与神经过敏相关的基因座。在这里,研究者对神经过敏症进行了大规模gwas荟萃分析(n=449484),确定了136个独立的全基因组显著基因座(分析时为124个新基因座),涉及599个基因。后续的功能分析显示,多巴胺能神经母细胞、中等多刺神经元和血清素能神经元在多个脑区富集,并涉及特定细胞类型。基因集分析涉及三种特定途径:神经发生、对可卡因过程的行为反应和轴突部分。研究者发现神经质的遗传信号部分来源于遗传上可区分的两个亚类(“抑郁情绪”和“忧虑”),暗示了个体亚型的不同因果机制。孟德尔随机分析显示,神经过敏症和多种精神类性状之间存在单向和双向效应。这些结果增强了神经生物学对神经质的理解,并为功能后续实验提供了具体线索。
(三)
association analyses of more than 140,000 men identify 63 new prostate cancer susceptibility loci
对14万多名男性的关联分析确定了63个新的前列腺癌易感位点
迄今为止,全基因组关联研究(gwas)和精细定位工作已经确定了100多个前列腺癌(prca)易感位点。本研究对来自46939例prca病例和27910例欧洲血统对照定制高密度芯片的基因型数据进行了荟萃分析,先前的基因型数据为32255例prca病例和33202例欧洲血统对照。本研究的分析确定了62个与prca相关的新位点,一个位点与早发prca显著相关(≤55岁)。研究者的发现包括atm中的rs1800057和cdkn1b中的rs2066827这些错义突变。所有基因座的组合解释了prca家族相对风险的28.4%,多基因风险评分显示相比于人群平均水平,百分之九十到九十九百分位区间和≥99%的百分位区间男性的prca风险增加。。这些发现改进了风险预测,增强了精细定位,并提供了对prca潜在生物学的洞察。
(四)
four evolutionary trajectories underlie genetic intratumoral variation in childhood cancer
儿童期癌症肿瘤内遗传变异的四种进化轨迹
个性化肿瘤学面临的一个主要挑战是,在同一肿瘤中的癌细胞之间的驱动突变不同。这是否反映了达尔文进化论在不同肿瘤区域的不同模式,目前还没有定论。本研究定位了流行的54种儿童癌症具有遗传差异克隆的250多个区域,表明原发肿瘤可以在不同解剖区域同时追踪四条进化轨迹。最常见的模式是由只有很少突变局限于单个肿瘤区域的亚克隆组成。第二个最常见的是在大片区域以染色体数目变化为特征的克隆稳定共存。这与第三种不太常见的,以通过克隆扫描找到的可以支配解剖区域驱动突变或结构染色体重排的克隆形成对比。第四种也是最罕见的模式是大量tp53失活克隆的局部出现。病死率仅限于表现出最后两种最动态模式的肿瘤。
(五)
defining endemic cholera at three levels of spatiotemporal resolution within bangladesh
孟加拉国三个时空分辨率水平界定地方性霍乱
尽管霍乱流行病受到了很大关注,但最大的负担发生在霍乱流行的地区,包括南亚、非洲和现在的海地地区。孟加拉国达卡是一个霍乱高发的特大城市,每年有两次季节性霍乱爆发。尽管如此,对于在这种环境中传播的霍乱弧菌菌株的多样性以及它们与每年爆发的关系的详细了解尚不清楚。在这里,研究者以最大可能的分辨率,对霍乱弧菌进行了多层次的全基因组测序。本研究分析了细菌分离物,从个体内部的感染到家庭一级的疾病动态,再到区域和洲际霍乱传播,从多个层面定义霍乱动态。本研究的分析为了解流行环境中霍乱的多样性和传播提供了基因组框架。
(六)
using an atlas of gene regulation across 44 human tissues to inform complex disease- and trait-associated variation
利用44个人体组织的基因调控图谱来预知复杂的疾病和性状相关变异
本研究应用整合方法分析来自44个组织的基因型-组织表达项目和全基因组关联研究数据的表达数量性状位点(eqtls)。大约60%的已知性状相关基因座与cis-eqtl连锁不平衡,其中一半以上在以前的大规模全血研究中没有发现。将多基因分析应用于代谢、心血管、人体测量、自身免疫和神经退行性特征,研究者发现eqtls在相关致病组织中的特征关联方面得到显著富集,并解释了很大一部分遗传度(40-80%)。尽管组织特异性eqtls对某些性状如血压等有更大的贡献,但对于大多数性状来说,组织共有eqtls具有更大比例性状关联基础。通过将来自生物途径的信息与eqtl目标基因整合,并应用基于基因的方法,本研究验证了先前可能的致病基因和途径,提出了几个复杂性状新的变异和关联基因,并在英国生物库和biovu中得到印证。
(七)
a transcriptome-wide association study of 229,000 women identifies new candidate susceptibility genes for breast cancer
一项针对22.9万名女性的转录组范围关联研究确定了乳腺癌的新候选易感基因
在全基因组关联研究中发现的乳腺癌风险变异仅解释了家系中相对风险的一小部分,而导致这些关联的基因在很大程度上仍然未知。为了确定新的风险基因座和可能的致病基因,研究者对122977例阳性和105974例欧洲血统对照样本进行了转录组范围的关联研究,通过对乳腺癌风险基因表达预测来评估遗传关联。研究者利用基因型-组织表达项目的数据建立遗传模型来预测乳腺组织中的基因表达,并使用癌症基因组图谱的数据评估模型性能。在评估的8597个基因中,在bonferroni校正的阈值下,鉴定了48个基因的显著关联,其中14个基因位于尚未报道的乳腺癌基因座。本研究后续沉默了13个基因,显示11个基因对细胞增殖和/或集落形成效率具有影响。本研究为乳腺癌遗传学和生物学提供了新的见解。
(八)
micee is a ncrna-protein complex that mediates epigenetic silencing and nucleolar organization
micee是一种ncrna蛋白复合物,介导表观遗传沉默和核仁组织
大多数真核生物基因组被转录成非编码rnas (ncrnas),它们是通过控制染色质结构来调控不同细胞核进程的一些重要调控因子。然而,ncrna的全部功能尚未完全知晓。在这里,研究者破译了microrna mirlet7d 作为双向转录基因关键调节因子的功能。本研究发现mirlet7d结合了这些基因表达的ncrnas,之后mirlet7d–ncrna双链进一步与c1d结合,反过来又靶向rna外泌体复合物和polycomb抑制复合物2 (prc2)双向活性位点。外泌体降解ncrnas,使得prc2通过ezh2诱导异染色质和转录沉默。此外,这些被称之为micee的多组分rna -蛋白质复合物,可以使调控基因到核仁周围区域,为核仁的组织构成所必需的。本研究表明,micee复合物介导双向表达基因的表观遗传沉默和整体基因组组织。
(九)
an interactome perturbation framework prioritizes damaging missense mutations for developmental disorders
一种优先考虑发育障碍的破坏性错义突变的互作组干扰框架
识别疾病相关错义突变仍然是一项挑战,尤其是在大规模测序研究中更加突出。本研究建立了一种通过实验和计算整合来研究错义突变在人类互连网络环境中的功能影响的方法,并通过在孤独症患者及其未受影响的兄弟姐妹中的分析,利用发现大约2000个新的错义突变来检验该方法。互作组干扰中的新错义突变在孤独症先证者中更常见,主要影响中枢蛋白,干扰中枢相互作用的比例明显高于未受影响的兄弟姐妹。此外,它们倾向于破坏涉及先前与孤独症有关的基因的相互作用,提供补充证据,加强先前确定的关联,并促进新关联的发现。重要的是,通过分析来自六种疾病的新错义突变数据,研究者证明互作组干扰的方法提供了一个可概括的框架,用于识别和区分导致人类疾病风险的错义突变的优先级。
(十)
leveraging molecular quantitative trait loci to understand the genetic architecture of diseases and complex traits
利用分子数量性状基因座了解疾病和复杂性状的遗传结构
越来越多的证据表明,利用全基因组关联研究发现的许多风险基因座是分子数量性状基因座(qtls)。在这里,研究者利用基因型组织表达(gtex)和blueprint的数据,介绍了一组基于因果后验概率分子精细定位cis-qtls的新功能注释。这些注释在41种疾病和复杂性状在遗传力上更为富集,包含所有重要分子qtls。通过所有gtex组织获得的eqtl注释的meta分析,表现最好,而组织特异性eqtl注释对血液和脑相关疾病和特征产生更强的富集。限于功能丧失不耐受基因的eqtl注释在遗传力方面更加富集。除了剪接qtls之外,所有的分子qtls在联合分析中保持显著富集,这表明这些注释中的每一个对于疾病和复杂的性状结构都是独特的信息。
(十一)
de novo variants in neurodevelopmental disorders with epilepsy
癫痫神经发育障碍的新发变异
癫痫是神经发育障碍(ndds)的一个常见特性,但对有癫痫和无癫痫的ndds之间的遗传差异知之甚少。本文分析了6753名亲子三代中确定具有不同ndds的新变异体(dnvs)。在1942名患有癫痫的ndds的个体的子集中,研究者鉴定了33个dnvs显著过量的基因,其中snap25和gabrb2 以前只有有限的疾病关联证据。对所有患有ndds的个体进行联合分析还发现cacna1e是一种新的疾病相关基因。比较ndds与癫痫和非癫痫,研究者发现错义dnvs、特定基因中的dnvs、招募年龄和智力残疾的严重程度与癫痫相关。进一步证明了本结果对目前遗传检测和治疗的影响程度,强调了准确遗传诊断对癫痫ndds的好处。
(十二)
accurate genotyping across variant classes and lengths using variant graphs
利用变异图对不同类别和长度的基因进行精确分型
目前通常利用短序列数据,基于与线性参考基因组的比对结果来进行基因分型,但是源自更加复杂变异(例如,结构变异体)的序列常常比对不良,导致基因型估计的偏差。这种偏差可以通过首先收集一组不同方法得到的个人和数据库候选变异,然后同时将变异和参考序列重新比对来改善。然而,这个序列重新比对问题在计算上是困难的。在这里,研究者提出了一种它使用精确比对的序列k-mers,图形化展示参考和变异的新方法(bayestyper),以便在整个变异谱中有效地执行无偏差的概率基因分型。本研究证明,与现有方法相比,bayestyper在跨方法和个体整合变异时,提供了更高的变异敏感性和基因分型准确性。最后通过包含已知变异的“变异优先”数据库证明可以显著提高灵敏度。