2024 年第54 卷第1 期
BEV-radar:毫米波雷达-相机双向融合的三维目标检测
赵园1,张露2,邓家俊3,张燕咏1✉
(1.中国科学技术大学计算机科学与技术学院,安徽合肥 230027;2.合肥综合性国家科学中心人工智能研究院,安徽合肥 230088;3.悉尼大学电子工程系,澳大利亚南威尔士州 2006)
✉通讯作者:张燕咏,E-mail: yanyongz@ustc.edu.cn
摘要:在自动驾驶场景下的3D 目标检测任务中,探索毫米波雷达数据作为RGB 图像输入的补充正成为多模态融合的新兴趋势。然而,现有的毫米波雷达-相机融合方法高度依赖于相机的一阶段检测结果,导致整体性能不够理想。本文提供了一种不依赖于相机检测结果的鸟瞰图下双向融合方法 (BEV-radar) 。对于来自不同域的两个模态的特征,BEV-radar 设计了一个双向的基于注意力的融合策略。具体地,以基于BEV 的3D 目标检测方法为基础,我们的方法使用双向转换器嵌入来自两种模态的信息,并根据后续的卷积块强制执行局部空间关系。嵌入特征后,BEV 特征在3D 对象预测头中解码。我们在nuScenes 数据集上评估了我们的方法,实现了48.2 mAP 和57.6 NDS。结果显示,与仅使用相机的基础模型相比,不仅在精度上有所提升,特别地,速度预测误差项有了相当大的改进。代码开源于https://github.com/Etah0409/BEV-Radar。
关键词:三维目标检测;传感器融合;毫米波雷达
引用格式:JUSTC,2024,54(1): 0101
QGAE:用于生成问答对的端到端无答案问题生成模型
李林枫1,张立成2,朱池苇1,毛震东1✉
(1.中国科学技术大学网络空间安全学院,安徽合肥 230027;2.中国科学技术大学信息科学技术学院,安徽合肥 230027)
✉通讯作者:毛震东,E-mail: zdmao@ustc.edu.cn
摘要:问题生成的目标是生成有意义且流畅的问题,以增加可用数据来解决问答类型标注语料库的缺乏问题。以带有可选答案的未注释文本作为输入内容,问题生成可以根据是否提供答案分为两种类型:有答案型和无答案型。即使在提供答案的情况下,生成问题也是具有挑战性的,更不用说在没有提供答案的情况下,对于人类和机器来说生成高质量的问题更加困难。为了解决这个问题,我们提出了一种名为QGAE 的新型端到端模型,它能够通过直接提取候选答案,将无答案的问题生成转化为有答案的问题生成。这种方法有效地利用未标记的数据来生成高质量的问答对,其端到端的设计使其比多阶段方法更加方便,后者需要至少两个预训练模型。此外,我们的模型获得了更好的平均分数和更大的多样性。我们的实验结果表明,QGAE 在生成问答对方面取得了显著的进展,成为了一种充满潜力的问题生成方法。
关键词:深度学习;自然语言处理;无答案问题生成;答案抽取
引用格式:JUSTC,2024,54(1): 0102
无监督异常检测模型的鲁棒性基准
王培1,翟伟1,曹洋1,2✉
(1.中国科学技术大学自动化系,安徽合肥 230027;2.合肥综合性国家科学中心人工智能研究院,安徽合肥230088)
✉通讯作者:曹洋,E-mail: forrest@ustc.edu.cn
摘要:由于生产环境的复杂性和多样性,了解无监督异常检测模型对常见降质的鲁棒性是至关重要的。为了系统地探索这个问题,我们提出一个名为MVTec-C 的数据集来评估无监督异常检测模型的鲁棒性。基于这个数据集,我们探索了五种不同范式的方法的鲁棒性,包括基于重建的、基于表征相似度的、基于归一化流的、基于自监督表征学习的和基于知识蒸馏的范式。此外,我们还探讨了两种最佳的方法中不同模块对鲁棒性和准确性的影响,包括PatchCore 方法中的多尺度特征、邻域大小、采样比例和Reverse Distillation 方法中的多尺度特征、MMF 模块与OCE 模块、多尺度蒸馏。最后,我们提出了一个特征对齐模块 (FAM),以减少降质带来的特征偏移,并将PatchCore 和FAM 结合起来,得到一个同时具备高准确率和高鲁棒性的模型。我们希望这项工作能够作为一种鲁棒性评估手段,并在将来为构建鲁棒的异常检测模型提供经验。
关键词:鲁棒性基准;异常检测;无监督学习;自动光学检测
引用格式:JUSTC,2024,54(1): 0103
基于秘密共享的隐私保护联邦学习高效安全聚合方案
金旋1,姚远志2✉,俞能海1
(1.中国科学技术大学网络空间安全学院,安徽合肥 230027;2.合肥工业大学计算机与信息学院,安徽合肥230601)
✉通讯作者:姚远志,E-mail: yaoyz@hfut.edu.cn
摘要:联邦学习使得多个移动参与者在不透露其本地隐私数据的情况下联合训练全局模型。通信计算代价和隐私保护性能是联邦学习的关键基础问题。现有的基于秘密共享的联邦学习安全聚合机制仍然存在引入显著额外计算代价、隐私保护性能不足和应对参与者掉线能力脆弱等问题。本文致力于通过引入灵活高效的秘密共享机制解决上述问题。本文提出了两种新颖的隐私保护联邦学习方案,分别是基于单向秘密共享的联邦学习(FLOSS)和基于多发秘密共享的联邦学习 (FLMSS) 。与当前的相关工作相比,FLOSS 通过动态设计秘密共享的内容和对象,在显著降低通信代价的同时保证高强度的隐私保护性能。FLMSS 进一步降低额外计算代价并且能够提高联邦学习应对参与者掉线的鲁棒性,从而在隐私保护和通信计算代价之间取得令人满意的平衡。安全性分析和基于真实数据集的性能评估证明了本文提出的方案在模型准确度、隐私保护性能和通信计算代价方面的优势。
关键词:联邦学习;隐私保护;秘密共享;安全聚合
引用格式:JUSTC,2024,54(1): 0104
基于双模态智能鞋的偏瘫患者下肢肌力定量评估
龙华君1,李洁2,李瑞2,刘新峰2,程敬原3✉
(1.中国科学技术大学大数据学院,安徽合肥 230027;2.中国科学技术大学附属第一医院神经内科,安徽合肥 230001;3.中国科学技术大学计算机科学与技术学院,安徽合肥 230027)
✉通讯作者:程敬原,E-mail: jingyuan@ustc.edu.cn
摘要:卒中可导致患者下肢运动能力受损和偏瘫。准确评估下肢运动能力对诊断和康复很重要。为了使每次测试都可随时追溯,并避免主观性,我们使用配备有压敏鞋垫和惯性传感单元的双模态智能鞋进行数字化评估,并设计了一个包括左转弯和右转弯的5 米步行测试方案。数据收集自23 名患者和17 名健康受试者。两位医生对所有患者的下肢的运动能力进行了观察,并使用医学研究委员会的五级肌肉检查量表进行了评估。两位医生对同一患者的平均评分被用作真实值。使用我们开发的特征集,在对患者和健康受试者进行分类时达到了100%的准确性。对于患者的肌肉力量,使用我们的特征集和回归方法获得了0.143 的平均绝对误差和0.395 的最大误差,与每位医生的评分相比 (平均绝对误差:0.217,最大误差:0.5),更接近实际情况。因此,我们验证了使用这种智能鞋客观准确地评估中风患者下肢肌肉力量的可能性。
关键词:卒中;机器学习;智能鞋;下肢肌力
引用格式:JUSTC,2024,54(1): 0105
各向同性磁流变弹性体磁相关非线性动态力学行为的本构模型
汪伯潮1,李颜1,逄浩明1,徐振邦2,龚兴龙1✉
(1.中国科学院材料力学行为与设计重点实验室,中国科学技术大学近代力学系,安徽合肥 230027;2.中国科学院空间光学系统在轨制造与集成重点实验室,中国科学院光学精密机械与物理研究所,吉林长春 130033)
✉通讯作者:龚兴龙,E-mail: gongxl@ustc.edu.cn
摘要:各向同性磁流变弹性体是一种将磁性颗粒随机掺入到聚合物基体中制备而成的智能材料。在磁场作用下,其模量发生快速、可逆、连续变化,在振动控制领域显示出良好的应用前景。实验结果表明,各向同性磁流变弹性体的动态力学行为具有很强的频率、应变幅值和磁场相关性。尽管上述行为对于其潜在应用具有重要的影响,但目前关于各向同性磁流变弹性体磁相关非线性动态力学行为的理论研究则关注不够。为准确评价各向同性磁流变弹性体的动态力磁耦合行为,并指导其相关产品的设计,本文建立了一个基于连续介质力学理论,反映各向同性磁流变弹性体磁相关非线性动态力学行为的本构模型。随后,开发了和本构模型对应的数值实现算法,并对模型的预测能力进行了验证。该模型有助于深入理解各向同性磁流变弹性体磁相关非线性动态力学行为的潜在力学机制。此外,该模型有助于指导基于各向同性磁流变弹性体产品的设计和应用。
关键词:各向同性磁流变弹性体;频率相关;应变幅值相关;磁相关;非线性粘弹;本构模型
引用格式:JUSTC,2024,54(1): 0106