岳翔 呼和 贾建忠
摘要:古生物化在判断生油母质、油气生成和保存时代以及分析沉积环境中扮演重要角色。然而,传统的微观化石识别鉴定工作效率低下、费时费力,且主观性较强,常规方法已不能满足高效、快速油气勘探评价的需要;本文提出一种基于深度学习的有孔虫化石识别方法,在三分类数据集上实验了VGG16模型和GoogLeNet模型,识别平均准确度为85%。该方法可以大大减轻古生物鉴定人员的工作量,解决古生物专业人才匮乏问题,同时提高成果共享和利用效率。
关键词:有孔虫鉴定;CNN;深度学习;VGG16;GoogLeNet
中图分类号:TP311 文献标识码:A
文章编号:1009-3044(2019)27-0173-01
1 引言
古生物化石如同沉积地层的“身份证”,记录着地层形成的年龄、气候、地理和地貌等关键信息,在判断生油母质、油气生成和保存时代以及沉积环境分析中扮演重要角色。与我们耳熟能详的三叶虫、恐龙等大化石不同,在钻井岩心或岩屑中保存的一般是显微镜下才能观察到的微观化石。它们虽然渺小,却以“数量取胜”,在地层中几乎无处不在;它们寿命虽短,但演化迅速,更有利于精细确定地层年龄,对环境变化的反应也更敏感。要用好这张地层的“身份证”,关键在于对化石进行准确分类和鉴定。
目前化石鉴定的主要方法是专业人员通过观察标本的外部形态和内部结构,查找文献、工具书、化石图册等相关研究资料,比照图版并结合自身经验,鉴定化石的属种。但随着古生物学研究和油气勘探需求的快速发展,化石鉴定工作中一些不容忽视的问题便日渐凸显。
1)古生物属种多、数量大,人工鉴定效率低,花费了从业人员大部分时间与精力。而且,中国近海钻井数量庞大,实验鉴定人员任务繁重。若这些时间与精力被用于更高层次的研究,或许能取得更有价值的科研成果。
2)人才匮乏,主观性强。具备古生物分类知识的专业人才不足,不利于科研成果快速转化和应用。另外,鉴定过程受专业人员主导,鉴定结果具有主观性。化石鉴定工作中主观误判不可避免,相同标本不同人员鉴定可能得出不同的结论。
2 技术思路与算法设计
深度学习是一个复杂的机器学习算法,在语音和图像识别方面取得的效果,远远超过先前相关技术,它的最终目标是让机器能够像人一样具有分析学习能力,能够识别文字、图像和声音等数据。卷积神经网络(Convolutional Neural Network,简称CNN)是深度学习的一种重要算法。卷积神经网络是在BP神经网络的改进,与BP类似,都采用了前向传播计算输出值,反向传播调整权重和偏置。VGG16模型是牛津大学发布的卷积网络模型,GoogLeNet是Google公司发布的卷积网络模型。GoogLeNet和VGG16是2014年ImageNet挑战赛的冠亚军。
使用CNN模型对有孔虫化石图片进行识别。模型训练流程如图1所示,首先对图片进行预处理,统一图片大小,然后进行模型训练,训练完成之后保存模型。
3 实验结果
收集三类有孔虫图片,每一类大约60张图片,共计180张,利用VGG16模型和GoogLeNet模型进行鉴定实验;从数据集中随机选取80%的数据作为训练集,20%的数据作为测试集,进行10次实验,结果如表1所示。
4结论
本文提出一种基于深度学习的有孔虫化石识别方法,利用CNN模型对有孔虫化石图片进行种属鉴定,通过实验验证此方法在三分类的数据集上准确度可以达到85%,是一种可行的有孔虫化石鉴定方法。在此基础上可以建设浮游有孔虫智能识别系统,准确、方便地识别化石属种、时代及古环境信息,提高应用成效;进一步推动古生物研究及其油气勘探应用走向数字化、智能化。
参考文献:
[1] 赵贤淑,张俊岭,陈德岭. 多元统计分析在古生物化石分类鉴定中的应用[J].西安矿业学院学报, 1996, 16(2):183-185.
[2] 夏菁,白志强,王宝鹏,等. 化石自动鉴定技术研究现状与展望[J].地球科学前沿,2013,3: 159-164.
[3] 夏菁,白志强,王宝鹏,等. 牙形石数字图像采集与图像增强方法研究[J].古生物学报, 2014,53(3):392-399.
[4] Hossein Izadi,Javad Sadri,Nosrat-Agha Mehran.A new intelligent method for minerals segmentation in thin sections based on a novel incremental color clustering[J].Computers & Geosciences,2015(81):38-52.
[5] 劉敏.基于小波分析和神经网络的油气产能预测与应用[D].武汉:武汉理工大学,2009.
[6] 焦李成,杨淑媛,刘芳,等.神经网络七十年:回顾与展望[J].计算机学报,2016,39(8):1697-1716.
【通联编辑:梁书】