品质至上,客户至上,您的满意就是我们的目标
技术文章
当前位置: 首页 > 技术文章
Plant Phenomics | 小麦麦穗自动检测大规模图像数据库:为可用于农业生产和研究现场的AI算法测试奠基
发表时间:2020-10-14 11:46:13点击:1884
在国际协作下,来自7个国家、9个研究机构的十几名研究人员创建了基于提高通用性的图像来自动检测小麦麦穗的大规模数据库。
构建了用于小麦AI研究的国际图像收集平台和识别标准。
以此数据为契机,举办了以小麦麦穗识别为目的的世界性图像识别比赛。期待通过这次竞赛带动今后农学领域AI研究的快速发展。
2020年8月,Plant Phenomics发表了题为Global Wheat Head Detection (GWHD) Dataset: A Large and Diverse Dataset of High-Resolution RGB-Labelled Images to Develop and Benchmark Wheat Head Detection Methods的研究论文。来自7个国家、9个研究机构的十几名研究人员通过国际共同研究构建了Global Wheat Head Detection (GWHD)数据集。这是世界首个汇集了大规模且富于多样性的带有标签的小麦麦穗图像数据集。在小麦栽培和研究现场,与麦穗有关的调查如单位面积的穗数等主要通过目测。为了减少此类劳动,研究人员们们正在推进通过图像分析和深度学习实现自动化的技术开发。然而,以往的研究通。常使用有限的数据集来创建麦穗的检测模型,不能创建出有通用性的模型。因此,来自7个国家9个研究机构的研究人员开展合作,共同收集了约19万份不同品种、不同生育阶段、不同栽培条件的小麦麦穗的高分辨率图像。此外还根据图像获取的指导方针和数据共享标准的FAIR原则(注1),提出了的最低限度元数据的关联以及统一的麦穗标记方法。GWHD数据集将在(http://www.global-wheat.com/)上公开,旨在为全世界的研究人员在麦穗识别方法的开发和数据标准的制定上提供参考。
近年来,运用最新的信息科学对作物进行高速、高精度的表型分析(以下称为phenotyping)的相关研究开发,在世界各地都很盛行。其中,对利用图像传感和机器学习的高速phenotyping有很高期待。比如,有多项研究成果表明,作为小麦产量主要构成要素之一的单位面积的穗数调查,也应该从原来的多名调查人员的肉眼计数变为基于深度学习的自动计数。然而,现有的研究成果大多以各自较少的实验数据为对象建立了麦穗检测模型,由于对不同的栽培条件、品种没有通用性,因此难以扩大规模。另外,麦穗的识别在计算机视觉研究领域也是一个难题。究其原因,不仅是观察条件、品种差异、生育阶段、麦穗的方向等有偏差,还有可能因风而造成的模糊、因密集个体群造成的重叠等,都是妨碍正确识别的主要因素。
为了能够制作出具有通用性的麦穗检测模型,以构建大规模且富于多样性的带有标签的小麦麦穗图像数据集为目标,发表者们与世界各国的研究人员开展了合作。日本东京大学和国立研究开发法人农业·食品产业技术综合研究机构(以下简称农研机构)、法国ARVALIS植物研究所和国立农学研究所、加拿大萨斯喀彻温大学、英国洛桑研究所、瑞士苏黎世联邦理工大学、中国南京农业大学、澳大利亚联邦科学产业研究机构和昆士兰大学的研究人员,从各自国家的小麦栽培现场,以各种方法收集了合计11个子数据集(Fig.1)。由于摄影手段和器材不同,收集的图像首先进行了数据的整合(Fig.2),最终生成了合计4,698张准图像的数据。这些图像的尺寸为1024×1024像素,每张图像含有20~70个麦穗(Fig.3)。此后,通过使用一种新的分析技术,使计算机提出是否存在需要人工判断的麦穗,可以使比以前更有效地选择用于机器学习的学习数据和麦穗的位置坐标的工作(批注工作)得以实现。并且,对各自的批注结果进行重新审查及手动修正,最终创建了存储了约19万小麦麦穗图像的Global Wheat Head Detection(GWHD)数据集。
Fig.1 Overview of the harmonization process conducted.
Fig.2 Examples of wheat heads difficult to label.
Fig.3 Example of images from different acquisition sites after cropping and rescaling.
利用所构建的GWHD数据集,2020年5月4日起,在IPPN(注2)组织的活动CVPPP 2020(注3)Challenge at ECCV2020(注4)中策划了“Global Wheat Head Detection challenge”,并在Kaggle(注5)举行,聚集了来自世界各地的2245支参赛小组(http://www.kaggle.com/c/global-wheat-detection)。本次挑战赛将以欧洲和北美收集的3,422张图像数据作为训练数据,澳大利亚、日本和中国的1,276张图像数据作为验证数据进行公开。并由加拿大的GIFS、日本的Kubota、法国的DigitAG和Hiphen赞助,悬赏15,000美元。本数据集的公开和世界级挑战大会的召开,使农业和研究现场的phenotyping研究和人工智能(AI)工具开发的快速发展备受期待。
Fig.4 Global Wheat Head Detection Challenge.
研究项目成员
E. David (Arvalis,Institut duvégétal,France. PhD Student)
S. Madec (Arvalis,Institut duvégétal, France. Post-doctoral fellow)
P. Sadeghi-Tehran(Plant SciencesDepartment, Rothamsted Research, United Kingdom. Computer Scientist)
H. Aasen (Institute of Agricultural Sciences, ETH Zurich, Switzerland. Dr.)
郑邦友 (CSIRO Agriculture and Food, Australia. Data Scientist)
刘守阳 (INRAE, France. 作物表型交叉研究中心, 南京农业大学. Dr.)
N. Kirchgessner (Institute of Agricultural Sciences, ETH Zurich, Switzerland. Researcher)
G. Ishikawa (National Agriculture and Food Research Organization Institute of Crop Science, NARO, Division of Basic Research, Breeding Strategies Research Unit. Senior Researcher)
K. Nagasawa (National Agriculture and Food Research Organization Hokkaido Agricultural Research Center, NARO, Division of Field Crop Research and Development, Wheat Breeding Group. Senior Principal Researcher)
M.A. Badhon (Department of Computer Science, University of Saskatchewan, Canada. Master Student)
C. Pozniak (Department of Plant Sciences, University of Saskatchewan, Canada. Professor)
B. de Solan (Arvalis, Institut duvégétal, France. Research Engineer)
A. Hund (Institute of Agricultural Sciences, ETH Zurich, Switzerland. PD Dr.)
S.C. Chapman (School of Foodand Agricultural Sciences, The University of Queensland, Australia. Professor)
F. Baret (INRAE, France. Research Director)
I. Stavness (Department of Computer Science, University of Saskatchewan, Canada. Associate Professor)
郭威 (Institute for Sustainable Agro-ecosystem Services, Graduate School of Agricultural and Life Sciences, The University of Tokyo. Assistant Professor)
备注
1. FAIR原则:FAIR是Findable(可发现)、Accessible(可访问)、Interoperable(可互操作)、Reusable(可重用)的缩写,描述了数据公开的适当实施方式,作为数据共享原则被国际社会提倡。
2. IPPN:国际植物phenotyping网络。
3. CVPPP:Computer Vision Problems in PlantPhenotyping。解决计算机视觉领域的植物phenotyping课题的研讨会。
4. ECCV:European Conference on ComputerVision。计算机视觉领域的顶级会议之一。
5. Kaggle:连接企业和政府等组织和数据分析专业的数据科学家/机器学习工程师的平台。
论文链接
http://spj.sciencemag.org/journals/plantphenomics/2020/3521852/
——推荐阅读——
Easy MPE: Extraction of Quality Microplot Images for UAV-Based High-Throughput Field Phenotyping
http://spj.sciencemag.org/journals/plantphenomics/2019/2591849/
Plant Phenomics | Easy MPE:基于无人机高通量表型技术提取高质量田间小区图像
A High-Throughput Phenotyping Pipeline for Image Processing and Functional Growth Curve Analysis
http://spj.sciencemag.org/journals/plantphenomics/2020/7481687/
Plant Phenomics | 一种用于图像处理和函数型数据分析的高通量表型方法
About Plant Phenomics
《植物表型组学》(Plant Phenomics)是由南京农业大学和美国科学促进会(AAAS)合作创办的英文学术期刊,于2019年1月正式上线发行,是Science合作出版的第二本期刊。采用开放获取形式,刊载植物表型组学交叉学科热点领域具有突破性科研进展的原创性研究论文、综述、数据集和观点。具体范围涵盖高通量表型分析的最新技术,基于图像分析和机器学习的表型分析研究,提取表型信息的新算法,作物栽培、植物育种和农业实践中的表型组学新应用,与植物表型相结合的分子生物学、植物生理学、统计学、作物模型和其他组学研究,表型组学相关的植物生物学等。期刊已被CABI、CNKI和DOAJ数据库收录。
说明:本文由《植物表型组学》编辑部负责组稿。中文内容仅供参考,一切内容以英文原版为准。
编辑:周灿彧(实习)、孔敏
审核:尹欢