王江宁,韩艳,纪力强*
1.中国科学院动物研究所,北京 100101
数据库(集)基本信息简介
数据库(集)名称 中国粉蝶标本图像特征数据集数据作者 王江宁,韩艳,纪力强数据通信作者 纪力强(ji@ioz.ac.cn)数据时间范围 1994年地理区域 中国数据量 1.62 MB数据格式 *.xlsx数据服务系统网址 http://www.sciencedb.cn/dataSet/handle/483基金项目国家自然科学青年基金(2016),基于在线学习的昆虫图像识别方法的研究及其在蝴蝶识别中的应用(31501841);国家科技部国家科技基础条件平台项目“国家基础科学数据共享服务平台”(DKA2017-12-02-20)数据库(集)组成本数据集收集了457幅中国粉蝶标本图像的分类信息,从中提取的颜色、形状、纹理特征数据,以及原始标本缩略图的索引。excel的sheet1表由4个字段组成,其数据样本描述可以参考《中国凤蝶标本图像特征数据集》一文的数据样本描述。关联数据集 《中国凤蝶标本图像特征数据集》,发表于《中国科学数据》2016年第1卷第3期,网址:http://www.csdata.org/p/34/。关联说明 数据集加工方法、质控方法的相同,标本数据源的生物类群不同。
动物的分类系统相对于其它生命的分类系统较为复杂、种类繁多,因此动物图像采集与其它生物图像采集相比较为困难。对于蝴蝶来说,从标本采集到图像采集,再至特征提取,能够使用的数据非常少。为了便于蝴蝶模式识别研究和应用,2016年我们发布了《中国凤蝶标本图像特征数据集》[1]。
粉蝶和凤蝶是蝴蝶的两大常见类群。继收集整理《中国蝶类志》(1994版)[2]中的凤蝶标本图片后,我们采用类似的方法[1,3],从457幅经过处理后的中国粉蝶标本图像中提取颜色、形状、纹理3个最常用特征的数值数据,得到粉蝶图像特征数据集,依然配有准确的分类学信息、模式识别方法。
由于本数据集与《中国凤蝶标本图像特征数据集》的采集方法、结构组成、质量评估和控制、使用方法等都相同,因此这些部分请参考关联文献[1],此处不再赘述。两者的比较如表 1所示。两者共同构成了更完整的蝴蝶标本图像特征数据集。但是因为数据获取需要时间,而且面向的蝴蝶类群不同,因此也是相对独立的数据集,是对蝴蝶整体数据的重要补充。昆虫分类学研究人员可以将其与凤蝶标本图像特征数据集结合使用。
表1 新旧数据集比较