袁敏老师研究组在Nature子刊《ScientificData》发布细粒度种子识别数据集成果


发布时间:2024-05-20   字体大小T|T

近日,兰州大学信息科学与工程学院袁敏老师研究组在面向智慧林草业的植物种子细粒度图像识别分类研究中取得新进展。相关成果以题为“A dataset for fine-grained seed recognition”在线发表于Nature旗下子刊《Scientific data》。

植物种子的研究一直是农林业研究的热点。随着人工智能在农业领域的应用,通过计算机视觉进行草种子识别可以有效赋能智慧农林业发展。研究组建立的一个细粒度种子识别数据集,名为兰州大学植物种子数据集(Lan Zhou University Plant Seed Dataset,LZUPSD),并在此基础上开展了一系列植物种子细粒度图像分类的研究,取得了一些成果。建立的LZUPSD数据集,共采集了4496张图像,每种种子约50张,共包含88种不同类型的种子,其中豆科植物最多,其次是禾本科植物。基于建立的数据集,采用基于深度学习、注意力机制等训练种子图像细粒度识别模型,采用多种深度学习模型对数据集进行了实验评估并进行可视化分析,团队还基于轻量化模型开发了植物种子识别的应用。该数据集不仅可以作为深度学习模型的训练数据,还可以为林草业、种业研究提供重要的数据支持。

国际上目前鲜有公开的植物种子数据集,该研究创建了国内第一个公开的实用草种子图像数据集,在此基础之上,紧密结合草业科学实际需求,运用计算机视觉技术,基于深度学习创新草种子鉴定分类手段和方法,实现杂草种子准确快速地分类识别。提高种子检验的效率,提升草业信息化水平。数字化技术是草种业未来的发展方向,进一步提升创新效率,将草业技术与信息技术融合,推动草业科学、种业向数字化、信息化、智能化方向发展。

兰州大学信息科学与工程学院袁敏为该文第一作者和通讯作者,兰州大学草地农业科技学院/草种创新与草地农业生态系统全国重点实验室胡小文老师为该文共同通讯作者。该研究得到了国家自然科学基金项目(No.62176108),甘肃省自然科学基金(No.21JR7RA457),2021年自然科学类中央高校科研业务费学科交叉创新团队建设项目(No.lzujbky-2021-ct09)和国家重点研发计划项目(2021YFC3201602)的资助。

《Scientific Data》是Nature旗下刊物(2022年IF=8.501),发行于2014年,致力于发表具有科学价值的数据集,以及能促进科学数据共享和再利用研究。数据集和源代码完全公开,结果可复现。

【数据集分享】为了促进相关领域的研究进展,与其科他研人员共享LZUPSD(Lan Zhou University Plant Seed Dataset),数据集链接为:https://doi.org/10.6084/m9.figshare.24552394.v1.

【引用】:Yuan, M., Lv, N., Dong, Y. et al. A dataset for fine-grained seed recognition. Sci Data 11, 344 (2024). https://doi.org/10.1038/s41597-024-03176-5

【原文链接】:https://www.nature.com/articles/s41597-024-03176-5

图1 整体方案流程

图2 种子科属分布

图3 部分植物种子图像示例