新闻中心

分子育种第四讲|隐秘的科技宝藏,GS应用场景大揭秘
发布时间:2023-12-21

全基因组选择是育种发展的一项新技术,推动着作物传统育种技术的改造升级。相比于传统育种,显著缩短了作物育种周期,提高了选择效率,降低了育种成本。具体的应用场景有以下几个方面:

微信图片_20231220143606.png

图1 全基因组选择应用场景


全基因组选择准确性的影响因素


基于全基因组选择的应用场景,可知该分子育种策略可广泛应用于动植物育种中,且具有提高遗传增益、降低育种周期与成本、加快育种进程等优势。但在实际应用中,育种准确性一直是难题,受多种因素影响,如:


训练群体


训练群体是用于构建模型的数据集,其规模大小、群体结构、有效群体大小及与预测群体的遗传关系都影响着GS的预测能力和准确性。


预测性状的遗传力


遗传力越高,育种值的准确性越高;低遗传力性状需要更多数量的基因型和表型数据才能获得较高的准确性。


表型性状测定的准确性


数量性状受环境影响较大,只有通过多年多点实验,平衡环境差异,同时提高测定指标的精度和准度,获得的表型数据用于建模和预测才会有较好的效果。


SNP的密度与位置


覆盖全基因组的标记密度越高,则与影响目的性状基因的LD值越高,准确性越高;SNP的位置对全基因组估计育种值的准确性影响较小,但是对基因型填充却很重要。


统计模型


统计模型是GS的核心,对GS预测准确性和效率有重要影响。由于性状形成的遗传调控机制复杂,没有固定模型算法能适用所有性状。针对具体物种、群体和性状选择并建立GS预测模型,结合机器学习与深度学习提高GS预测准确性和计算效率。


全基因组选择的展望


随着计算机科学和测序技术的发展,全基因组选择技术的可行性越来越强。目前测序成本降低,基于重测序获得SNP标记的方法日益成熟。随着全基因组选择统计模型的不断改进优化,模型的稳定性及准确性不断提高,但是依然面临两个重要的挑战,即计算准确性和计算效率,打破相关技术的障碍,全基因组选择的优势必将进一步凸显,得到更加广泛的应用。未来,可以采取多模型组合选择、多组学辅助GS等多种方法,提高育种准确性。


案例分享


案例一:基因组选择模型助力杂交稻优选育种


2023年7月在Nature Genetics期刊发表题为“Structure and function of rice hybrid genomes reveal genetic basis and optimal performance of heterosis”的研究成果,该文章的一些成果与全基因组选择技术息息相关,文章总结了水稻育种遗传规律,深入解析亚种间杂种优势遗传基础,并构建了基因组选择模型,以便快速筛选优良杂交组合。基于超万份材料的基因型和表型数据,构建了基因组选择模型。该模型能够根据杂交组合的基因组遗传变异信息预测材料的田间表现,并联合七个重要农艺性状的预测结果开展多性状选择,从而实现育种潜力个体的有效筛选,帮助育种者制定杂交计划,缩短育种周期,节约人力和时间成本。


图片1.png

图2 杂交水稻基因组选择模型的构建与验证


案例二:基因组选择模型助力辣椒性状预测及优异个体的筛选


2022年9月在Horticulture Research期刊发表题为“Genomic selection with fixed-effect markers improves the prediction accuracy for capsaicinoid contents in capsicum annuum”的研究成果,在本研究中,作者利用来自训练群体的基因型和表型数据构建了几个GS模型来预测辣椒选育系的辣椒素含量。以351份辣椒材料和96个选育品系为核心材料,分别作为训练群体和试验群体。作者使用3,294个SNP标记获得了不同模型的最高平均预测精度(0.550)。利用该标记集进行GWAS分析,筛选出25个与辣椒素合成基因相关的标记和辣椒素含量的数量性状位点。最后,为了建立更准确的预测模型,研究者从GWAS获得SNP标记作为GS的固定效应标记,其中3,294个全基因组SNP被使用。当使用GWAS的4-5个固定效应标记作为固定效应时,RKHS和RR-BLUP模型的准确率分别为0.696和0.689。本研究结果为利用GS测定辣椒素含量,培育不同辣椒素水平的辣椒品种奠定了基础。


图片2.png

图3 优良品系中不同数量SNP标记训练模型的预测精度


案例三:全基因组选择新方法DNNGP的提出


2022年11月Molecular Plant期刊发表题为“DNNGP, a deep neural network-based method for genomic prediction using multi-omics data in plants”的研究成果,作者提出了利用植物海量多组学数据进行全基因组预测的深度学习方法(Deep Neural Network for Genomic Prediction, 简称DNNGP),可以实现育种大数据的有效整合与利用,将助力深度学习在全基因组选择中的应用,为智能设计育种及平台构建提供有效工具。


图片3.png

图4 DNNGP的算法设计


参考文献


[1] Gu Z, Gong J, Zhu Z, et al. Structure and function of rice hybrid genomes reveal genetic basis and optimal performance of heterosis[J]. Nat Genet. 2023;55(10):1745-1756. 

[2] Kim GW, Hong JP, Lee HY, Kwon JK, Kim DA, Kang BC. Genomic selection with fixed-effect markers improves the prediction accuracy for Capsaicinoid contents inCapsicum annuum[J]. Hortic Res. 2022;9:uhac204.

[3] Wang K, Abid MA, Rasheed A, Crossa J, Hearne S, Li H. DNNGP, a deep neural network-based method for genomic prediction using multi-omics data in plants[J]. Mol Plant. 2023;16(1):279-293.