品质至上,客户至上,您的满意就是我们的目标
技术文章
当前位置: 首页 > 技术文章
Plant Phenomics | AI助力苜蓿根系表型研究,ResNet-18技术精准解析植物结构
发表时间:2024-11-12 10:45:11点击:43
根系结构(Root System Architecture,RSA)在通过地下根系性状实施植物改良方面正受到越来越多的关注。现代计算技术应用于图像,为通过RSA分析(使用图像识别/分类根系类型和特征)推进植物性状改良和选择提供了新的途径。然而,基于图像的RSA表型分析的一个主要障碍是图像标签噪声,这降低了以图像作为直接输入的模型的准确性。
2024年9月,Plant Phenomics在线发表了University of Minnesota和Washington State University等单位合作完成的题为Phenotyping Alfalfa (Medicago sativa L.) Root Structure Architecture via Integrating Confident Machine Learning with ResNet-18的研究论文。
为了解决标签噪声问题,Brandon J.Weihs等人开发了一种人工智能模型,能够直接从图像中对苜蓿(Medicago sativa L.)的RSA进行分类,并将其与下游标签改进方法相结合。将不同模型输出的图像与手动根系分类进行了比较,并测试了可信机器学习(CL)和反应式机器学习(RL)方法,以最大限度地减少主观标记的影响,从而提高标记和预测的准确性。
紫花苜蓿根颈RSA(根系结构)取样与成像、图像标签创建与校正以及模型实施的工作流程如下:其中橙色表示田野或实验室取样;紫色表示图像准备方法;蓝色表示建模方法;黄色表示图像标签校正过程;粉色表示图像标签校正步骤;绿色表示在新数据集上的模型验证及对未标记数据的预测;红色表示模型对新数据集图像的预测。
图1 紫花苜蓿根颈RSA(根系结构)取样与成像、图像标签创建与校正以及模型实施的工作流程
图2 从MN数据集导出的随机森林和ResNet-18混淆矩阵
图3 采用跨种群和合并分析的ResNet-18混淆矩阵
图2展示了四个不同的混淆矩阵,分别对应于两种模型(RF和ResNet-18)在原始和修正后的MN数据集上的表现:(A) 来自Xu等人的RF预测准确性 (B) 经修正的MN标签的RF混淆矩阵 (C) 原始MN标签的ResNet-18混淆矩阵。(D) 经修正的MN标签的ResNet-18混淆矩阵。图3展示了四个不同的ResNet-18混淆矩阵,它们展示了模型在原始标签、修正标签、合并标签以及合并可信标签下的性能:(A) 来源于原始(MN和OK)标签的ResNet-18混淆矩阵。(B) 来源于修正后(MN和OK)标签的ResNet-18混淆矩阵。(C) 来源于合并(n = 881)标签的ResNet-18混淆矩阵。(D) 来源于合并可信(n = 608)标签的ResNet-18混淆矩阵。
实验的结果证明,CL算法适度提高了随机森林模型对MN数据集的整体预测准确度(1%),而在ResNet-18模型的结果中观察到了更大的准确性提升。与原始/预处理的数据集相比,CL方法使得ResNet-18的跨种群预测准确度提高了约8%到13%。训练和测试数据组合中,预测主根RSA的最高准确度(86%)来自CL和/或RL修正的数据集。同样地,对于中间RSA类别的最高准确度也来自于修正后的数据组合。使用ResNet-18模型在包含两个采样地点图像的合并数据集上应用CL所达到的最高整体准确度约为75%。当采用CL和RL时,紫花苜蓿RSA图像标签的ResNet-18深度神经网络预测准确度得以提升。通过增加数据集规模以减少过拟合的同时发现并纠正图像标签错误,Brandon J.Weihs等人证明了使用半自动化的计算机辅助预处理和数据清理(CL/RL)可以实现高达约11%至13%的准确性提升。
论文链接:
http://doi.org/10.34133/plantphenomics.0251
——推荐阅读——
http://doi.org/10.34133/plantphenomics.0178
Plant Phenomics 综述 | 利用人工智能进行根系结构成像分析的最新进展
加入作者交流群
扫码添加小编微信,拉您进入《植物表型组学》作者交流群,群内不定期开展作者分享会、专刊发布会等高质量活动。
添加小编微信,备注姓名+单位+PP,加入作者交流群
About Plant Phenomics
《植物表型组学》(Plant Phenomics)是由南京农业大学创办的英文学术期刊,于2019年1月正式上线发行。采用开放获取形式,刊载植物表型组学交叉学科热点领域具有突破性科研进展的原创性研究论文、综述、数据集和观点。具体范围涵盖高通量表型分析的最新技术,基于图像分析和机器学习的表型分析研究,提取表型信息的新算法,作物栽培、植物育种和农业实践中的表型组学新应用,与植物表型相结合的分子生物学、植物生理学、统计学、作物模型和其他组学研究,表型组学相关的植物生物学等。期刊已被DOAJ、Scopus、PMC、EI和SCIE等数据库收录。科睿唯安JCR2023影响因子为7.6,位于农艺学一区(1/125名),植物科学一区(13/265名),遥感一区(6/62名)。2023年中科院期刊分区位于农林科学大类一区。2020年入选中国科技期刊卓越行动计划高起点新刊项目、2024年入选江苏科技期刊卓越行动计划领军期刊项目。
说明:本文由《植物表型组学》编辑部负责组稿。
中文内容仅供参考,一切内容以英文原版为准。
编辑排版:王平、张婕(上海交通大学)
审核:尹欢、孔敏