{dede:global.cfg_webname/}
  • English
  • 官方微信
  • 首页
  • 栏目名称
    • 测试
  • 第二个
  • 首页
  • 学院概况
    • 学院简介
    • 历史沿革
    • 机构设置
    • 现任领导
    • 历任领导
    • 联系我们
  • 师资队伍
    • 全职教工
    • 讲座 兼职教授
    • 重要人才计划
    • 退休人员名单
  • 人才培养
    • 本科生培养
    • 硕士生培养
    • 博士生培养
  • 科学研究
    • 学术交流
    • 重点学科
    • 科研机构
    • 科研团队
    • 科研成果
    • 讨论班
  • 党团建设
    • 党建动态
    • 工会活动
    • 团学工作
  • 理论学习
    • 主题教育
  • 合作交流
    • 国际合作
    • 校际合作
    • 校企合作
  • 招生就业
    • 招生信息
    • 就业信息
    • 招生宣传
  • 校友之家
    • 校友组织
    • 校友基金
    • 校友活动
    • 百年院庆
    • 校友动态
    • 知名校友
  • 院务信箱

学院新闻

  • 学院简介
  • 历史沿革
  • 机构设置
  • 现任领导
  • 历任领导
  • 联系我们

学院新闻

数学与统计学院本科生秦蒙恩以第一作者在Pattern Recognition上发表研究成果

日期:2026-05-19  作者:  点击:[]

河南大学数学与统计学院2025届统计学专业本科生秦蒙恩在模式识别领域Top期刊Pattern Recognition上发表研究成果“A3-FPN: Asymptotic content-aware pyramid attention network for dense visual prediction”,该成果在学院杨晓慧教授指导下完成,该生将赴美国伊利诺伊大学芝加哥分校攻读博士学位。



论文链接:https://www.sciencedirect.com/science/article/pii/S0031320326007582

代码链接:https://github.com/mason-ching/A3-FPN

研究成果聚焦基于均衡稀疏表示的深度学习方法在密集视觉预测中的应用。在密集视觉预测任务(目标检测、语义分割等)中,采用特征金字塔网络及其变体通过“自上而下”或“自上而下+自下而上”的路径来融合多尺度特征,已成为业界标配。然而,这套标准方案尚存在三个可以进一步完善的地方:(1)信息随着网络加深丢失。通过信息论中的数据处理不等式可以严格证明,路径越长,信息损失的上界越大。(2)采样针对性不强,导致边界模糊与目标位移。无论是上采样还是下采样,都是上下文无关的固定操作。它们不考虑图像内容,简单地复制或丢弃像素,导致物体边界在融合时变得模糊,小目标特征极易被淹没,造成定位框漂移或漏检。(3)简单相加,一定程度上忽略了特征模式的差异。不同层级的特征,其表示的“模式”可能截然不同。简单地将它们逐元素相加,相当于把不同“语言”的信息硬凑在一起,导致类别内特征不一致,模型容易产生混淆和误判。这三个问题共同导致了一个结果:模型在简单场景下表现尚可,然而遇到小目标、密集场景或复杂边界,性能就急剧下降。现有优化尝试大都集中在改进主干网络或损失函数上,然而忽略了如何做到充分且紧凑的均衡特征融合这个“咽喉要道”。

为解决上述问题,该研究工作提出了一种渐近内容感知金字塔注意力网络(A3-FPN)。其核心思想是用横向扩展的“列”结构,渐进式地将每一层特征从所有其他层中“解耦”出来,并在融合与重组阶段全程注入“内容感知”的注意力机制。所提出的方法适用CNN、Transformer等多种网络架构,并能灵活用于目标检测、分割等多种密集视觉预测任务。在COCO、VisDroneDet-2019, Cityscapes等多个领域通用公开数据集上刷新SOTA,且推理速度更快。


本文提出的A3-FPN总体框架图


A3-FPN和其他方法在目标检测任务上的对比效果


A3-FPN和其他方法在实例分割和语义分割任务上的对比效果

上一条:数学与统计学院召开2026届本科毕业生座谈会 下一条:数学与统计学院举办“跨学段教研携手,一体化育人同行”——课题申报研讨会

【关闭】

友情链接

  • 学校教务处
  • 学校党委办公室
  • 学校校长办公室
  • 清华大学数学系
  • 浙江大学数学科学院
  • 上海大学数学系
版权信息