基于YOLOv4-Tiny 的硬件加速系统的设计与实现

2024-06-01 02:48姜明飞冯凤阳冯赟魏天东陆山
电脑知识与技术 2024年10期
关键词:现场可编程门阵列目标检测卷积神经网络

姜明飞 冯凤阳 冯赟 魏天东 陆山

摘要:随着神经网络算法的迅猛发展,将其部署在边缘设备上面临着功耗和计算时间的制约。针对YOLOv4-Tiny算法在资源受限的边缘端部署困难等问题,文章提出了一项软硬件协同优化策略。为了提升硬件资源使用率和推理效能,文章采用了输入输出通道与权重通道的双重缓冲机制,并在此基础上,结合双缓冲结构与强化的高度并行流水线设计,开发了一种基于Zynq FPGA硬件平台的目标检测加速系统。实验结果显示,该系统在Zynq KV260平臺上的运行功耗仅为3.712 W,单帧推理时间缩短至0.43 s,与现有的FPGA硬件加速器平台相比,实现了更优的性能表现。

关键词:YOLOv4-Tiny;目标检测;卷积神经网络;硬件加速系统;现场可编程门阵列

中图分类号:TP311 文献标识码:A

文章编号:1009-3044(2024)10-0011-04

猜你喜欢
现场可编程门阵列目标检测卷积神经网络
视频中目标检测算法研究
基于深度卷积神经网络的物体识别算法
行为识别中的人体运动目标检测方法
D—BLAST基带系统的FPGA实现研究
深度学习算法应用于岩石图像处理的可行性研究
基于深度卷积网络的人脸年龄分析算法与实现
移动机器人图像目标识别
基于卷积神经网络的树叶识别的算法的研究
一种千兆以太网SerDes 接口与电接口的转换方法
基于P3电位的目标检测研究