为了获得更多遗传信息,我们常常要进行全基因组测序、snp芯片扫描及关联分析等。然而在将这些关联数据一网打尽的同时,往往泥沙俱下,有太多的“脏”数据很大程度上干扰了我们对关键信息的发现和判读,使得我们得出不准确甚至错误的结论。这就要求我们有必要进行不同群体和更大样本量的二次、甚至三次验证,以保证选择出snp位点在研究群体和样本中的准确性。
最近的2019年6月在《animal genettics》杂志上,就发表了一篇牛排卵和孪生率关联的snp验证的文章,结果在通过全基因组snp数据选择出的14个候选关联snp中,只验证出1个与不同群体性状相关联,提醒我们进行扩大群体二次验证的必要性。下面我们就简单看一下这篇文章。
文章题目:validation of snp associations with bovine ovulation and twinning rate与牛排卵和孪生率关联snp的验证
以前的工作在美国荷斯坦牛群体中鉴定并验证了与孪生率相关的遗传标记。利用1994-1998年的产犊记录首次在荷斯坦牛中检测到snp关联,然后利用1999-2006年的产犊记录进行验证。本文所述工作旨在验证这些标记关联在孪生率和排卵率关联在群体中的适用性。孪生群体来自12个不同品种的动物,荷斯坦-弗里斯牛在这一群体的基础上得到了很好的代表,既代表作为有多胎出生记录的荷斯坦奶牛,也作为有高孪生率的瑞典弗里斯牛。结对种群中的其他品种包括西门塔尔牛、夏洛莱牛、挪威红牛、棕色瑞士牛、布劳维耶牛、平兹高羊、盖尔布维耶牛、肖特霍恩牛、赫里福德牛和安格斯牛。本研究总共选择了18个单核苷酸多态性进行基因分型,所有这些都在美国荷斯坦牛群体中验证了相关性。使用质谱平台对snp进行基因分型,除去低call rate的snp后,最终剩下14个snp,673只牛个体纳入标记性状关联验证分析。统计分析中,孪生率结对率的固定效应包括分娩的年份和季节、分娩时的年龄和snp基因型的回归。每个snp的加性效应在单独的分析中进行拟合。排卵率的固定效应包括出生年份季节、排卵年龄、排卵月份和编码snp基因型的基因型回归。基于之前使用线性模型检测到的snp关联,研究者决定继续使用线性模型进行验证。此外,阈值模型可能存在收敛问题,固定效应估计可能更难解释。在这种情况下,阈值模型和线性模型之间的差异减小,因为双胞胎和卵子的数量在usmarc的双胞胎群体中更为居中,因此减少了任何误差膨胀。分析中使用的记录包括29571个排卵率和9186个结对率记录。如果效应估计值与先前的估计值一致,且显著性p < 0.01,则认为snp是有效的。
表1、美国荷斯坦牛群体中与结对率显著相关的snps在usmarc群体中的验证结果
在14个成功基因分型的snp中,只有一个证明了是有效性,p < 0.01 (表1)。与分析中包括的大多数其他snp不同,这些snp来自商业上可获得的snp panel小组。该snp被鉴定为位置候选分析的一部分,其中igf1基因在编码区和5’和3’侧翼序列中被筛选出多态性。可以推测,其他13个在荷斯坦群体中得到验证的snps,可能仅仅是假阳性结果。基于此处报道的结果,强相关的igf1 snp在荷斯坦牛群体之外的基因组预测中具有实用性,而其余的snp仅在荷斯坦牛群体中是合适的预测因子,这也要求针对不同群体在应用之前,需要对关联snp进行扩大群体和样本验证的必要性。有趣的是,这种snp与孪生率有关,但与排卵率无关,尽管这两个性状之间以前报道有很高的遗传相关性,这表明孪生率会随着对该等位基因的选择而发生变化。虽然没有证据表明这种snp具有功能作用,但igf1本身就是细胞生长的刺激因子,据报道,选择孪生的奶牛与对照奶牛之间的血液水平存在差异。
关于天昊
截止到2019年1月,天昊生物的snp分型平台共发表文章366篇,总影响因子1057分。除了提供多种天昊生物专利snp分型平台,我们还提供多种snp联合分析的研究思路给您,确定不需要立刻联系尊龙z6官网吗?邮箱:techsupport@geneskies.com电话:400-065-6886