王向峰在铁岭基地考察,看果穗的性状。 受访者供图
张晴丹
我国粮食总产量位居全球首位,玉米产量位居世界第二,但是育种技术体系的信息化与智能化程度与欧美发达国家相比,还有相当大的差距。
科研人员意识到,我国急需建设为玉米种业服务的玉米智能设计育种技术体系,为我国玉米育种行业解决“卡脖子”问题。
近日,中国农业大学农学院、国家玉米改良中心王向峰教授与西北农林科技大学生命科学学院、旱区作物逆境生物学国家重点实验室马闯教授课题组在《生物信息学简报》上发表了一篇方法学研究论文,论文介绍了科研团队联合开发的一款基因组优化设计模型GOVS,可以加速玉米杂交育种,缩短育种周期,促进玉米种业智能化、高质量发展。
亟需技术攻关,解决关键问题
21世纪以来,随着互联网、人工智能、机器学习等现代信息技术的迅速发展,全球已迈入大数据时代。信息科学与生命科学的跨学科交叉融合为育种科技的跨越式发展提供了新的契机。
2018年美国康奈尔大学玉米遗传育种学家、美国科学院院士Buckler教授提出“育种4.0”概念。我国的水稻遗传育种学家、中国科学院院士张启发教授也提出了作物育种已进入5G育种时代。
“美国基本已经进入育种4.0时代,也就是智能育种时代,但我国还没有实现这一步。”论文通讯作者王向峰在接受《中国科学报》采访时表示,无论是“育种4.0”或是“5G育种”,其本质都是育种行业的工程化、智能化升级,即逐步形成“智能设计育种”技术体系。
在他看来,智能设计育种是在分子设计育种的基础上融合生物信息学、群体遗传学、大数据、人工智能等多个交叉学科的育种智能化解决方案,是全基因组选择育种的升级和优化,是我国“十四五”期间种业创新工程中重点攻关的技术领域。
玉米智能设计育种技术体系可以帮助解决三方面关键问题。王向峰指出,首先,可以解决玉米育种行业研发周期长、效率低、成本高、决策难等问题;其次,催化现代种业与人工智能的融合发展,形成“智能+种业”的新经济产业体系;最后,打破育种技术壁垒,缩短与国际种业巨头之间的技术差距,振兴民族种业。
两款工具相辅相成
为什么美国育种水平比我国高?“因为他们通过几十年发展积累了大量育种数据,在整个育种过程中,每一个步骤都是通过大数据驱动,已经可以进行作物表型的模拟,根据模型预测来辅助育种家筛选材料进行杂交组配。”王向峰答道。
要想在种业科技创新上“弯道超车”,开发玉米智能设计育种技术体系成了当务之急。
“不过,大数据的高效采集、深度分析和充分利用,十分困难。”论文共同通讯作者马闯在接受《中国科学报》采访时表示,相比欧美发达国家,我国的育种相关生物学大数据还比较缺乏。以基因组数据、表型数据为例,之前采集这些数据的成本较高,近年来随着科技发展,相关成本有所下降,数据呈快速增长趋势,数据的高效采集问题正在解决,深度分析和充分利用问题还需要高度关注。
玉米要做杂交种,实际是两个纯和自交系杂交以后而形成。以前需要四五年才能生产出来一个纯和自交系,“现在的利好是单倍体诱导育种技术,基本上一年就可以生产出一个纯和自交系。”王向峰表示,双单倍体技术在玉米育种行业中的逐步成熟与普及,使得玉米纯和自交系的生产周期大幅缩短、成本大幅降低、自交系数量大幅度增加。
我国一个中、大型种业公司每年可生产2万到5万份的玉米自交系。自交系量已经达到如此规模,如果再将这些自交系与3到5个测验种进行杂交,理论杂交组合的数量为几十万。依赖于田间表型测试对数十万的组合进行人工选择的成本太高,是几乎无法完成的任务。
因此,科研团队认为,必须采用智能育种的方式,依据预测模型指导基于基因型的选系。
“假如有10万个自交系,再与一个测验种进行杂交,就有10万个杂交种,把它们都种在田里根本不可能。而用模型先在计算机上模拟,筛选出来产量最高、最优的10%的杂交种,在田间就可以只种这10%的部分,相当于种1万株,成本仅是原来的十分之一。”王向峰举例。
鉴于此,科研团队开发了基因组优化设计模型GOVS。传统育种模拟软件主要利用遗传材料的系谱关系和表型数据模拟育种过程,同时指导未来育种流程中的选系和组配。“GOVS则采用了称为‘基因组优化设计’的策略,即通过算法模拟出一个理论上尽可能多地聚合了某个育种群体中目标表型的优势基因组片段或有利等位基因的虚拟基因组。”论文第一作者、西北农林科技大学博士生程前告诉《中国科学报》,他还是GOVS软件的主要开发人之一。
程前表示,目前,这样一个理想基因组在现实中还不太可能得到,但是可以作为评估层面或者育种路径的一个指导。
在此之前,王向峰还与华中农业大学教授严建兵课题组在《基因组生物学》上发表了一款基于机器学习建立的全基因组选择模型——CropGBM工具箱,同时整合了多种常用遗传分析工具,比如基因型与表型数据预处理、育种材料遗传结构解析、全基因组选择模型、标记筛选与模块设计、数据可视化等功能模块,为作物基因组设计育种提供一站式解决方案。
“智能指的就是机器学习里面建立的模型,这个模型相当于人的大脑一样,是有驱动力的。GOVS与CropGBM相辅相成,分别用于不同的育种环节,实际上都是利用人工智能的策略加速育种。”王向峰说。
“强心剂”和“加速剂”
粮食安全事关国计民生与长治久安,种业是现代农业核心与命脉,科技创新是战略支持。要想培育具有自主知识产权的新品种,需要育种家不懈的努力。
“不过,育种现状却不容乐观。国内育种家普遍年龄偏大,大多已过50岁,而且他们多是凭经验、靠眼睛去决策选材料,每个人的经验又有差异。加上在田间搞测试的年轻人很少,以后的育种越来越不能靠人去完成,只能通过计算机做育种。”王向峰表示。
而机器学习最大的两个亮点,一个是效率,一个是自动化。用模型去代替育种家的经验,做更加标准化、规范化的决策,既减少育种家的工作量,又降低了许多成本。
“育种要‘藏粮于技’,我们这个成果是智能育种方法学和技术的大胆突破,也是给国内做相关育种工作科研人员注入‘强心剂’。”马闯说。
此外,他指出,相较于国外育种4.0理念,我国如何去追赶、超越,迈入“育种4.0”或是“5G育种”更先进的时代,需要更加先进的技术,这项成果也是“加速剂”。
“要明确的是,我们这套技术并不是基因组选择的替代,我认为基因组选择在未来育种体系中仍是核心技术,最大优势是可以大幅度减少田间工作量和成本,不可取代。而我们这套技术如果和基因组选择、双单倍体技术相结合,会得到更好的效果。”程前强调。
当前,科研团队正围绕玉米智能设计育种技术体系的建设开展多方面的工作,力争打造大数据驱动的玉米智能育种服务平台,为全国范围内的种业企业、育种团队提供智能决策服务。
有了这样一个服务平台,未来育种流程中的组材、选系、组配、测试、推广等诸多环节都将由一系列模型进行育种决策,辅助甚至代替人工决策,最终实现数据驱动式的智能设计育种。
相关论文信息:
https://doi.org/10.1093/bib/bbab447
https://doi.org/10.1186/s13059-021-02492-y
科学网2021年11月7日
责任编辑:
刘铮