典型样例分析 研究团队选取了两个有代表性的样例来表明迭代过程。可以看到最开始的迭代步骤里,time square和cubs的类型被错误地预测了;然而根据哈工大提出创新迭代推理框架 DPE-MNER :充分发挥多模态表示潜力中的重要特征线索,迭代地修正为了正确的实体类型。 结论 本文旨在多模态命名实体识别(MNER)领域内,充分地发挥各种多模态表示的潜力,以期获得卓越的识别效果。为此,作者们设计并提出了一种创新的迭代推理框架——DPE-MNER。 DPE-MNER通过将MNER任务分解为多个阶段,巧妙地简化了对这些丰富多样的多模态表示的整合过程。在这一迭代过程中,多模态表示依据“分解、优先排序和消除”的策略,实现了动态的融合与整合。通过一系列严谨的实验验证,研究团队充分展示了DPE-MNER框架的显着效果和优越性能。 参考文献:[1] Knowledge Graphs Meet Multi-Modal Learning: Comprehensive Survey, arxiv[2] Decompose, Prioritize, and Eliminate: Dynamically Integrating Diverse Representations for Multi-modal Named Entity Recognition,2024,Joint International Conference on Computational Linguistics, Language Resources and Evaluation[3] Complex problem solving : Principles and mechanisms,1992, American Journal of Psycholog[4] DiffusionNER: Boundary Diffusion for Named Entity Recognition, ACL23 [5] DiffusionDet: Diffusion Model for Object Detection, ICCV23[6] Language-Guided Diffusion Model for Visual Grounding , arxiv23