近日,我校人工智能学院智能信息处理与优化控制实验室在International Conference on Machine Learning (ICML) 2026上发表了题为“PromptPilot: Game-Theoretic Multi-Agent Prompt Optimization for Segment Anything”的学术论文。该论文的第一署名单位为太原理工大学,计算机科学与技术学院(大数据学院)博士生师广泽为第一作者,软件学院22级本科生米英杰为共同第一作者,人工智能学院刘雪宇副教授、吴永飞副教授和计算机科学与技术学院(大数据学院)魏明强教授为共同通讯作者。

ICML是机器学习与人工智能领域最具影响力的顶级国际会议之一,被中国计算机学会评选为CCF-A类国际顶会,与NeurIPS、ICLR并称为人工智能与机器学习领域最权威的三大国际顶级学术会议。作为全球机器学习研究者发布前沿成果、交流学术思想的重要平台,ICML长期以来在学术界与工业界均享有广泛影响力,会议聚焦机器学习与人工智能的最前沿理论与技术,涵盖深度学习、生成模型、强化学习、概率建模、优化方法、可信人工智能、多模态学习、机器人、计算生物学、语音识别等多个核心方向,旨在展示和推动机器学习领域的最新理论与算法突破、方法创新与应用进展,论文录用竞争激烈,代表了相关研究领域的国际高水平认可。ICML 2026共有23,918篇投稿,最终6,352篇被录用,录用率约26.6%。

该研究聚焦于视觉基础模型 Segment Anything Model(SAM)在实际应用中的关键问题——如何自动获得高质量提示点。现有提示优化方法在优化阶段未纳入SAM反馈,而在推理阶段又依赖SAM生成最终分割结果,由此产生了优化过程与分割目标之间的错位。为此,团队创新性地提出了一个基于博弈论的多智能体提示优化框架PromptPilot,将提示优化过程建模为合作博弈,在优化过程中显式引入SAM的分割反馈,并利用高效的Shapley value近似方法量化提示点的边际贡献,从而实现对高价值提示点的保留和低效、误导提示点的剔除。实验结果表明,该方法在自然图像、医学图像和视频目标分割等多类场景中均表现出良好的泛化能力与鲁棒性。

该论文是团队继CVPR2025、CVPR2026连续发表的系列工作,论文的发表展示我校在人工智能前沿领域持续的科研产出能力,同时也展示我校鼓励本科与研究生人才的创新培养机制。
此项工作受到国家自然科学基金面上项目(No. 62572339)与山西省基础研究计划(No. 202303021211082)的资助。
初审:吴永飞
复审:李晓春
终审:陈永乐