基于深度学习的水下模糊环境下鱼类识别研究 通信工程专业.docx
《基于深度学习的水下模糊环境下鱼类识别研究 通信工程专业.docx》由会员分享,可在线阅读,更多相关《基于深度学习的水下模糊环境下鱼类识别研究 通信工程专业.docx(12页珍藏版)》请在课桌文档上搜索。
1、中国大陆的海岸线长达18000多千米,有着丰富的海洋资源。鱼可不只有作为人类的盘中餐这个作用,还是生态链里面的重要平衡者,没有了他们生态都会遭到巨大的破坏,也是地球上重要的海洋生物资源,所以对于水产养殖的现代化管理,渔场环境的实时监测,尤其是水下模糊环境下的鱼类识别对我国开发和利用海洋鱼类等生物资源有着不可或缺的价值。传统的鱼类图像识别往往存在识别速度慢,识别率低,误判率,漏检率高等问题。随着现代信息社会,新科技,新技术,新设施的发展以及深度学习算法框架的完善,许多基于深度学习的水下鱼类图像识别算法被提出,例如:基于R-CNN深度学习的鱼类目标检测算法、基于水下图像底层特征的鱼类目标检测等算法
2、,但通常都因为水下环境恶劣、可见性差、拍摄图片品质差等因素导致最终识别效果很差。本文将深度学习优秀的学习能力以及可移植性好等优点运用于水下模糊环境的鱼类识别领域,开展了基于深度学习的水下模糊环境下鱼类识别研究。目前YOLv5在目标检测领域从速度和精度综合来看,是明显优于其它先进的目标检测算法如:EfficientDet.SSD.FastR-CNN等。所以本文提出一种基于YOLOV5算法的水下模糊环境下鱼类识别模型。本文的主要工作和成果如下:(1)本文拍摄并制作了共计3595张水下模糊环境下的同种鱼类图片数据。为了克服水下模糊环境下拍摄图片整体光照强度低、可视范围小、水下背景模糊、杂质多等问题,
3、首先,在预处理阶段采用暗通道先验算法,以提高图像的清晰度、明度,减少图片品质导致人工数据集标注的误差。(2)针对YoLov5算法召回率低、mAP(平均准确度)低的问题,研究采用XXXXXX。实验结果验证了本文基于改进YoLoV5算法的水下模糊环境下鱼类识别模型的有效性。关键词:鱼类鉴别;目标检测;Y0L0;深度学习1绪论1.1 研究背景还要生态系统是迄今为止己有的生态系统中最大的,海洋发展战略的提出,让它的相关所有物种数目都得到了提高。地球上约有200万种不同的海洋生物。海洋里面的鱼类扮演了人们的食物餐品和生态系统重要的调节者的两个角色,两个方面都赋予了无可替代的职能。因而在水产养殖行业的智能
4、化运营、鱼类生活环境的生物检测,特别是如何辨认深水区的鱼类品目这些关键的技术的学习和掌握对我们国家海洋业的各方面发展都气到了很重要的作用。鱼类检测和识别系统可以探索海洋生物的活动规律,运于改进水产养殖捕捞的方式,并在海洋鱼类知识科普宣传、海洋环境管理、稀有生物保护等领域有广泛的用途。其为检测海洋的鱼类品种的重要辅助工具,为今后对未知海域探索的有力保障。鱼类识别问题,由于鱼类的形态各异,大小不一,且水下拍摄图像存在能见度低,环境复杂,噪声大等问题。因而和另外的检测工作来比有了更高的要求。传统实现鱼类识别与分类的算法是基于传统的机器学习。首先由人工根据事物设计特征,然后向分类器中输入特征向量来完成
5、分类任务。然而,人工特征提取往往存在着特征提取困难、缺乏泛化性与通用性、工作量复杂又耗时等不可避免的缺点。近年来,由于人工智能在图像处理、自然语言处理、语言识别等诸多领域的取得了很大的成就,基于深度学习的图像识别技术得到了快速发展,并广泛应用于人脸识别、行为识别、字符识别等领域,具有很高的识别水平和识别精度以及鲁棒性。本文将深度学习优秀的学习能力以及可移植性好等优点运用于水下模糊环境的鱼类识别领域,开展了基于深度学习的水下模糊环境下鱼类识别研究。在解决了以前的方式不容易得到特性的难题的基础上,还有提升图像的精确度和增大可以辩识的位置。在水下模糊环境下,基于深度学习的鱼类识别检测将是一个非常重要
6、的研究课题,它不仅能克服传统方法中的特征提取难的问题,而且可以提高图像识别的准确率,扩大识别范围。同中国进行更多的海洋渔业的使用起到了很大的帮助。1.2 国内外研究现状1 21深度学习在图像识别领域研究现状对算法设计的全面理解一开始是作用于图像的处理方面。2018年的图灵奖获得者加拿大人杨立昆在1989年与他的合作伙伴就发现了卷积神经网络(CNN),CNN为一类包含了卷积层的全面神经网络模型。理论上来说,独立的卷积神经网络结构可以由一对特殊化处理的非线性卷积层、两个固定子采样层和一个全连通层构造出来。它最低包含了五层隐藏层,它是通过胡贝和维塞尔这两个专家建造的动物视觉模型为基础来构思的,尤其在
7、动物的Vl和V2视觉皮层里面的各种类型的细胞的功能的借鉴。它在图像大小的方面获得了很大的突破。但是,CNN持续了很多年依旧没有得到创新,主要是因为卷积神经网络在大尺寸图像中不能达到理想的效果,计算机无法理解存在大量像素的自然图像中的内容,因此CNN在计算机可视化技术这个范畴里并不能造成很大的改变。2012年10月Hinton教授和他的学生AIeXKriZheVSky构建了一个由65万多个神经元、6000多万个待估计参数组成的卷积神经网络,在著名的ImageNet问题上取得了37.5%的Topl错误率。取得了当下最好的图像识别处理结果,极大地促进了深度学习在工业领域的综合应用,使深度学习在图像识
8、别领域取得了良好的成就。CNN至今为止,在图像识别这个领域已经进去了它发展的天花板阶段。然而辛顿于2012年发展并发表的深度神经网络却在行业里掀起了巨大的浪花。创新之处在于提升了神经系统的算法机制,权值衰减被于神经系统调节的过程被应用,以减小权值的幅度,阻碍网络的过度拟合情况。而且,计算机包括运算和CPU在内的能力正在光速提高,所以能够得到越来越多的结果在练习中得到发挥,让计算机的因特网上能够拿到拟合度比之前高的联系用的参数。中国的互联网领军企业百度公司早就在2012年就将它应用在很多识别(人间、物象)上,还利用它设计和制造了许许多多对方式产生了爆炸性影响的商品。到现在为止,深度学习网络模型对
9、很多的人或者物的图像识别和记载已经能实现很高的精确度了。深度学习模型在提升识别方面的准确率和功能性上已经很成熟,还节省了大把的曾经浪费在识别上的时间避,让运行速率有了让人叹为观止的进步。I52目标检测方法自从2006年至今,在欣顿、班吉奥、杨立昆等专家学者的带领下,深入研究出了不少的相关深度神经网络的学术论文。辛顿教授与他的弟子克里泽夫斯基创建了一个具备65万多个神经元、6000多万个待估计数据的卷积神经网络,而且给它取了一个名字为AIeXNet网络,非常大地升高了卷积神经网络的分类精度。从这以后,卷积神经网络被绝大多数专业人士所熟知。现如今,以卷积神经网络的为基础的模型很多都是在计算机视觉领
10、域被使用。大多数是被用在目标定位与识别、目标检测、语义分割等。运动目标的研究是计算机视觉领域的一个重要研究方向,许多基于卷积神经网络的模型也被使用。计算机对目标运动的分析大方向能够分为3个方面:运动分割、目标检测、目标跟踪、动作识别和行为描述。目标检测是运动目标分析一个重要方面,同时运动目标的研究也是分析监控视频的基本任务。因为监控视频设备局所不具备的很多功能导致的环境、分辨率、气候、光线等方面和环境的多样性问题,因为视频画面中的物体体态不同,经常会出现物体被遮挡,运动不规则,而目标检测算法的结果会影响后续的跟踪、动作识别和行为描述。因此,目标检测技术还需要进一步的研究,以适应实际应用中的各种
11、场景。目标检测技术一般应用于图像中存在多个目标的场景中。我们不仅要检测目标的位置,还要同时识别多个目标。即目标定位和目标分类。目标分类就是输出一系列分数矩阵来表示感兴趣的对象是出现在输入图像中还是图像中选定的部分中,表示感兴趣的对象出现在输入图像中还是图像中选定的部分的可能性。目标定位是确定目标在输入图像或选定图像中的位置和范围。边界框通常用来表示对象的位置信息。目前,目标检测算法主要是基于深度学习模型,可以分为两类:(1)两阶段目标检测算法,将目标检测问题分为两个阶段,第一阶段在第二阶段先生成区域,使用卷积神经网络把候选帧分成许许多多的种类,我们大部分应用的算法有:R-CNNFastR-CN
12、N.FasterR-CNN和R-FCN等。(2)One-Stage要完成第二个目标的算法是RegionProPosals,完全在因特网里寻找特征来预测物体类别概率与位置坐标信息,常见算法有YOLO.SSDRetinaNet和CornerNet等。一般而言,Tow-Stage算法较为准确,而One-Stage算法较为快速。下面对上述两种类型的算法进行介绍。两阶段目标检测算法两阶段目标检测算法准确率较高,而One-Stage算法较为快速。TWo-Stage算法的目标检测任务分为两个阶段,第一阶段首先尝试识别并预测物体位置,第二步则加工第一次的检测结果来获取目标图像更准确的坐标信息,然后再依次对每个
13、候选区进行单阶段目标识别。R-CNN为RossGirshick首次应用的利用替补区换掉传统滑动窗口的目标检测算法,这个算法总共需要进行三个过程,首先基于SeleCtiVeSearCh(选择性搜索)生成一些候选的区域即Proposals;然后对于这些候选区进行长和宽的归一化后,输入到CNN中提取特征,最后,利用SVM(SUPPOrtVeCtOrmaChine)分类模型结合NMS(non-maximumsuppression),利用窗口评分来抑制每类对象的非最大值,并提出重叠建议框。最后,得到各类回归校正后得分最高的窗口,并得到区域边界,以判断候选区域中是否有目标以及目标的类别。该算法需要大量的特
14、征提取,计算量大,耗时长。RossGirshick在R-CNN的基础上提出了FastR-CNN目标检测算法叫该算法将特征获取和分类放在在一个网络中进行联合训练。使用RoI-PooIing层代替了空间金字塔池化操作,加速了CNN提取特征的过程,RolPoOIing是利用一个固定尺寸的矩形框将特征进行分割,得到不同候选区域,继而把这里的候选区域的特殊性质传入Softmax分类器和位置回归函数里面。这样的方式把在网络中加入了多任务函数边框回归,完成了端到端目标检测算法。任少卿,何凯明等人为了解决曾经有目标检测算法检测速度迟缓的麻烦,制订了FaSterR-CNN目标检测算法。该方法使用了RPN(Reg
15、ionProposalNetwork)区域建议网络代替了SelectiveSearch,极大地提高了生成PrOPOSalS的速率。整个算法大致可分为两个步骤:第一步是在滑动窗口上生成大小和长度与宽度比率不同的锚框,设置IOU的阈值,并根据GrOUndTrUth(正确地)校准这些锚框。标记)的标志。因此,传递到RPN网络的样本数据将分类为锚框坐标以及每个锚框中是否有对象(两个分类标签)。RPN网络将每个样本映射到一个概率值和四个坐标值。概率值反映了锚框具有对象的概率,并且使用四个坐标值进行回归以定义对象的位置。最后,将两个分类和坐标回归的损失统一起来,作为RPN网络的目标训练。RPN所获得的区域
16、建议书根据概率值进行筛选后,经过类似的标记过程,然后传递到R-CNN子网中进行多分类和坐标回归,并且多任务损失也被用于组合分类损失函数和回归损失函数。RPN所获得的区域建议书根据概率值进行筛选后,经过类似的标记过程,然后传递到R-CNN子网中进行多分类和坐标回归,并且多任务损失也被用于组合分类损失函数和回归损失函数。RPN所获得的区域建议书根据概率值进行筛选后,经过类似的标记过程,然后传递到R-CNN子网中进行多分类和坐标回归,并且多任务损失也被用于组合分类损失函数和回归损失函数。该方法避免了上述方法的对大量候选区域进行检测的操作,减少了目标检测的时间。1222单阶段目标检测算法与两阶段目标检
17、测算法不同,单阶段目标检测算法将物体分类和物体定位放在一个步骤,没有生成候选区过程,直接从图片获得预测结果,也被称为RegiOn-free方法,不仅简化了目标检测的整个过程,同时大大减少了目标检测所需的时间,在检测处理速度上更加满足现实实际需求。YOLOv1(YouOnlyLookOnce)把没有剪裁过的图片作为网络的输入,把图像划分成SXS的几个部分,所有的网格来说,研究时都把他当做有B个边框(含有所有边框是目标的置信度和所有边框区域在不同的类别上面的概率),在前面的基础上我们能得道SXSXB个目标窗口,再按照IoU阈值排出很少有可能性的目标窗口,最后一步是NMS删除冗余窗口即。输出结果不仅
18、仅有各种类别的置信度,还有预测框的位置坐标。该方法一个网格只预测两个框,因此无法对小目标和靠得很近的物体进行有效的检测。SSD算法把Yc)LOVl算法没有很好的检测性能这个方面改良升级了,检测速度不降低的同时还在增强了检测算法的性能。该算法对先验框的尺寸进行了固定,每个特征中有固定个数的先验框以进行检测,同时,该算法考虑到低层特征中小目标特征较为明显,使用了多个尺度的特征来进行检测,以解决YOLoVl算法中的小目标检测较差的问题。Y0L0v2(RedmonJetal.)为YoLOVl算法的一个多个问题补丁加强的版本,该方法设计了一个新的特征提取网络来提取图像的特征,并使用聚类算法来确定先验框的
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 基于深度学习的水下模糊环境下鱼类识别研究 通信工程专业 基于 深度 学习 水下 模糊 环境 鱼类 识别 研究 通信工程 专业
链接地址:https://www.desk33.com/p-537861.html