生猪育种数字化体系建设思考
文|张佳
微猪科技
一
概述
生猪遗传育种最主要的工作就是识别出符合选育目标的优质种猪,进行最优组合的选配,最终生产出更加优秀的后代,实现品种改良的目的。无论是选种或选配,都离不开数据的支持。数据的采集、整理、分析及挖掘能力是育种工作人员的一项基本功。营养和育种是养猪领域与数据打交道最多的专业。对数据的应用让育种人更早就用数据说话,让数据决策。在新的数字化浪潮中,育种部门应继续引领行业,带动数字化体系的建设。
如今,高质量畜牧业发展对生猪育种数字化体系建设提出了新的要求。生猪育种的数字化建设在很多组织中都被提上议程,最新的人工智能、大数据、云计算等技术在精准、高效的育种改良中得到应用。
二
育种数据采集技术
信息采集是遗传育种岗位最重要的工作。对种猪的系谱管理、生长和繁殖性能数据测定、遗传评估、后备选留和选配等工作都涉及到一系列的数据采集、加工、计算、分析和应用等工作。大规模、低成本、高效率采集数据的技术成为全行业关注的焦点。
(一)数据采集
个体识别是数据采集的基础,而耳缺和耳牌是最常见的个体识别技术。目前多数育种公司根据《NY/T 820-2004 种猪登记技术规范》进行种猪个体编号,即“第10位至第13位用数字表示场内窝序号;第14位至第15位用数字表示窝内个体号;”。随着定制耳牌的集团公司和规模企业越来越多,“窝号+个体号”会带来较大的浪费,企业开始使用连续编号的方式来进行管理。因应这一现状,最新的育种软件增加了自动生成连续编号的功能。我们建议有关部门在修订国家标准时,考虑这个现实情况。关于耳标的技术要求,农业农村部最近组织制修订了《牲畜耳标技术规范(修订稿)》和《牲畜电子耳标技术规范》。
经过多年的实践,RFID耳标已经相对成熟。目前瑞佰创、睿畜等企业已经进行了大量落地工作的尝试。RFID配合仔猪秤、过道秤、耳标阅读器以及对应的信息化系统可以形成非常完整流畅的育种评估流程。育种企业可以根据应用场景的不同选择低频耳标(LF)或超高频耳标(UHF),但是成熟完整的育种解决方案仍然不多。测定站的个体识别主要使用近距离的LF耳标,家庭农场的资产管理销售二元母猪的盘点和记录则可以使用远距离的UHF耳标。仔猪出生后,使用智能耳标钳打上电子耳标并进行称重。这样耳标号和体重同时上传系统,自动完成后裔登记和体重记录。销售种猪时,UHF电子耳标可以快速获取猪的个体号,生成销售清单。
猪脸识别是个体识别的另外一种方式,最初的目标是用于遗传育种、资产确权(金融、保险理赔)。目前,猪脸识别的研究还在进行中,多个团队在这方面都投入了大量的资源。行业还没有见到大规模应用。此外,有一些公司使用刺青等技术来进行猪的个体识别。
经过十几年的发展,绝大多数育种企业已经配置了完整的测定设备。目前种猪测定工作中采集最多的表型性状包括体重、背膘及眼肌面积等。但目前多数主流设备并不能自动完成数据的采集和传输工作。自动化测定系统得到应用以实现数据采集的需求。通过RFID电子耳标、自动称重和采食记录,种猪的生长性能和饲料效率可以得到实时记录。测定数据在设备与软件系统的自动对接工作仍在进行中,微猪科技已经与部分同行启动对接工作。
在屠宰性状方面,背膘和眼肌面积仍然是主要的性状。而个别领先的企业开始使用CT技术进行屠宰性能的评估,甚至开发了专门的分析软件。将猪麻醉后,CT技术可以对猪活体不同部分的组织构成进行分析。有一些研究将CT结束后猪采食量的变化作为新的性状来评估,用以反映猪的应激情况并评估抗病遗传能力。
(二)数据记录与数据清洗
传统的种猪育种工作,主要依靠手工测定和记录数据,然后输入到遗传评估软件计算估计育种值,得到结果后再手工计算待选留猪只的选择指数。除了传统的方法和设备采集,还有一些新型的数据采集技术,例如微猪科技研发的智能表单。智能表单利用人工智能技术自动识别育种员手写的表格,并保持非常高的准确率。扫描后的表单自动上传到服务器,不仅可以节省人工、提高效率,同时能达到防篡改的效果。在很长的一段时间里,仍将有大量数据需要以手写的方式来记录,智能表单是一个兼顾平衡的绝佳方案。
智能表单技术:猪场只需要按指定格式的纸质表格填写日常生产数据,使用扫描仪扫描成图片上传给系统,即可自动识别填写内容,并整理成识别结果,经确认后写入系统。智能表单识别准确率高达99.98%。
采集后数据需要进行专业的数据清洗,避免不符合逻辑的无效数据进入数据库。系统设计时,应根据生猪生产的科学逻辑、繁殖规律、数据合理范围、系谱检查以及数据间的勾稽关系设置一系列规则对采集或导入的数据进行核查,提供多层校验,保障数据的准确性。除了规范的业务要求,还要兼顾现实存在的一些问题,避免因过于严格的规则导致真实的数据无法录入。此外,对于一定年限以上的陈旧数据,有可能会存在大量不符合逻辑的数据。对于此类数据,如果全部修改需要耗费大量的人工。导入陈旧历史数据时可以考虑仅导入数据,但陈旧数据不用于日常的运算和分析。
种猪育种企业的规模正在不断扩大,当前采用测定站技术采集饲料效率的成本仍然不菲。企业需要性价比更高且高效运转的技术体系来增加表型收集的数据和规模。数字化技术不断推陈出新,最新的智能硬件及软件让大量新型数据得以采集并应用。有条件的企业可以开始采集猪的各类声音及图像信息。例如,未来可以利用最新的计算机视觉技术大规模、低成本地实时获取猪的称重。目前群体估重时的个体视频仍未得到很好的解决方案,而且栏位内的生猪估重在落地时仍然没有达到非常成熟的水平。整个方案的落地在当前的条件下仍然需要大量实践验证。方案成熟后,可以大量应用于后代商品猪群的信息采集。
三
精准育种信息平台
(一)遗传评估
遗传评估计算是当前生猪育种工作的关键与核心。遗传评估需要跨越多个学科来更好地深入研究分析。现有的BLUP系统主要有DMU、PIBLUP、HIBLUP和FastBLUP等。而种猪企业则多数使用已经整合好育种模块的育种软件,个别企业会将数据从生产系统中导出到遗传评估系统进行计算。推荐育种企业在选择或建设育种系统时使用一体化的系统,或组织团队将生产系统和育种系统打通,避免多套数据并行的情况。在育种数字化体系布局时,应尽早就后代商品猪场的信息纳入数据采集和分析的体系。目前PIBLUP等系统已经支持将商品猪信息纳入遗传评估体系。
当前的养殖集团规模日益增长,且遗传评估的指标及内容也在增加。传统的系统在面临这些新的需求时,往往需要耗费大量的时间来生成计算结果,甚至无法生成。同时,基因组选择、基因芯片等需要更加与时俱进的育种系统支持。这些新的挑战都给育种工作带来了新的问题。新型算法可以利用最新的云计算和多核技术进行实时高效计算,并取得良好进展。企业在规模育种数字化系统时,应选择经过效率提升和细节优化的算法,确保及时生成相应的报表并指导决策。同时,建议优先考虑云计算平台以应对高性能计算的挑战。
由于遗传评估的计算量大,过去的系统往往会在凌晨或其它的特定时间进行育种值的计算。但这种方式会导致测定当天无法及时得到遗传评估结果,极端情况可能会影响到种猪的及时调拨和销售。微猪科技采用人工智能的算法智能判断测定数据的采集情况,并在数据采集完成后自动进行遗传评估及育种值的计算。这样育种团队可以及时获取计算结果,实现随算随用的遗传评估。种猪在测定后可以当天得到选留,加快销售效率,避免优质种质资源流失,从而平衡生产经营和育种效率之间的矛盾。
育种指数等内容经常会因群体增大以及时间变化而发生变动,而历史计算结果往往不能回溯。这是育种人员经常遇到的一个痛点问题。育种系统需要对这些计算得到的窝选表、结测表、选配表及遗传评估结果进行自动存档和数据隔离,育种人员不用每个月手动存报表。
基因组选择技术在近年来得到了越来越多的应用。企业在选择育种评估系统时同样需要关注这方面的模块和功能。
(二)数据交换及数据标准
过去的数据往往停留在不同的系统内部。数据需要在组织间、系统间交换得到流动与对接。数据交换是生产与育种以及其它业务融合的基本条件。育种企业应积极推动不同硬件与软件的交换标准,让数据流动起来。专业的硬件以及业务系统内部形成数据闭环,并通过标准接口进行数据交换,形成高内聚、低耦合的架构。进行硬件选型时,应选择支持网络交换数据的硬件。如果因通讯条件、数据安全等原因不能进行网络传输,数据应当可以通过存储介质进行传输。育种企业应用整体采集解决方案时,需要建设统一的物联网中心平台。目前相对成熟的方案包括摄像头、RFID电子耳标、自动饲喂站、自动测定站、饮水监测(智能水表)、智能电表等。在规划时,要同时考虑技术的成熟度和采集后的应用场景。
在生产及育种系统融合时,需要厂家共同提供各种相应的接口,让数据在不同硬件及软件平台之间的无损交换。数据连接在理论上并不困难,但经过多年的发展仍未得到解决。其中的原因包括产品繁多,没有人承担连接成本;硬件自身不具备基本参数及功能;愿意长期投入的厂商数量有限;大部分硬件市场占有率低,维护难度大等。
为了更好地实现数据交换,系统可以采用低耦合设计,(有限)支持不同数据的一次录入,同时进入多套系统,形成统一的采集平台。同时,最好有跨平台的数据分析功能,让数据在系统间流动。
四
数据发掘及数字资源开发应用
数据的价值只有得到应用后才能体现。育种数字化正是通过最新的技术让选种、选配更加精准,并实现育种效益最大化。
环控设备的出现让育种者可以获得稳定的环境并将环境效应最小化。在这一前提下,育种工作者可以获得更精准的数据。同时,对表型数据与环境数据进行深度挖掘,可以进一步发现更多有价值的信息。而自动化的测定站则可以提供采食频率、时间长短、剩余采食量等有价值的信息。育种工作者可以利用最新的商业智能(BI)技术及机器学习技术来分析这些数据并获得更多有价值的信息。BI技术是用于呈现数据发掘和分析结果的重要手段,数据专家们常用的软件有PowerBI、Tableu等。
计算效率仍然在继续高速发展,而成本则不断下降。声音、图像、行为等新的表型数据在未来将会得到更多的应用。我们需要发掘并设计出一系列可靠的方法来进行大规模的采集和分析工作。通过声音,育种工作者可以研究母猪的行为与产仔之间的关系,如压死的机理以及其与基因的关系。对于研究抗病遗传的专家,猪群的咳嗽可以得到精准的度量,一些定性的指标得以数字化。图像和视频同样可以提供大量的行为信息。育种工作者可以总结并制定各种性状的数字化标准,包括猪的头部形态、公猪的性欲表现、母猪的温驯度等。机器学习和人工智能物联网这几年得到了非常迅猛的发展,技术迭代日新月异。养殖现场的育种师们在构建数字化体系时,现在就可以着手筛选关注的指标,与数字化解决方案的供应商共同寻求落地方案。
在育种决策支持时,需要根据最新的技术发展对原有的方案和流程进行革新。以选配方案制定为例,除了更加流畅的流程设计外,同时对多个因素进行自动配置和选择。已经制定好的选配方案需要进行自动存档和后期的执行度检查验证。
每个集团都有专门的遗传评估参数及模型。系统需要为育种总监提供个性定制的参数设置,支持与不同遗传评估模型对接。料肉比、CT等大量新的技术催生了新的选育性状,但相应的育种模型及软件支持仍然有限,需要根据育种目标定制选育性状并提供系统支持。
五
育种数字化组织建设
在规模育种企业,可以建设集中的数据运营部门或数据中心。在不同地点的育种人员,可以通过互联网轻松连接到同一个育种数据库,进行相关操作。集团可以建立专门的数据中心,将数字化育种精英的作用发挥起来。
在人员配置方面,育种总监负责育种方案制定、核心群规划及建设、育种工作统筹等工作。公司应配置至少一名具备数据分析能力的育种专员,主要工作包括数据检验整理、选留表、选配表、淘汰清单等任务制定、测定计划及配种计划执行度检查、育种进展分析、数据深度分析及应用等工作。现场应配备相应人数的测定员,以完成种猪测定所需要的各项数据采集工作。在数字化组织建设过程中,人员的培养和培训必不可少。公司应定期进行遗传育种、基因组选择、信息技术、统计常识、数据分析等知识的培训。培训完成后,及时开展测试和实践考察。
六
未来展望
生猪育种的数字化正处在高速发展的阶段。大数据、人工智能、云计算、深度学习技术等技术将会逐步得到大规模应用,新的机器学习方法将会取代传统的统计技术与方法。在育种技术方面,基因组技术应用的广度和深度仍在进一步扩大,而最大化杂交性能的育种目标成为新的方向。同时,商品猪生产及屠宰信息进入育种评估体系。多学科的融合仍在进一步加深,遗传育种与生产经营、营养、兽医等学科间的交叉进一步加深。越来越多的用户将使用移动终端完成育种工作,移动端的应用频率将会进一步提升。
我们同时还应看到,当前育种企业仍应加大创新力度,大胆应用最新的数字化解决方案。而数字化供应商应着力提升计算效率、用户体验并进行移动端优化。软件系统不应关心采购人和决策者喜好,忽视基层用户的需求。这些弊端也是当前一些系统在采购后没有得到推广反而荒废空置的部分原因。在保持现有设施的前提下,正常运转的育种企业则可以探索如何优化现有育种流程的技术细节以便顺利进行数字化变革。
作者简介
张佳,微猪科技合伙人。译著《现代养猪生产技术》、《猪群健康管理》。曾任福建永诚副总经理、一春农业总经理、网易农业副总经理、卡美副总经理、天邦汉世伟副总裁。
来源:2021年01期《猪业》【种猪育种技术与种业发展】专题