1.【CVPR2024】阿里云人工智能平台PAI像编辑算法论文入选CVPR2024
【CVPR2024】阿里云人工智能平台PAI像编辑算法论文入选CVPR2024
近期,阿里云人工智能平台PAI在计算机视觉与模式识别顶级国际会议CVPR-中展示的源码源的由图像编辑算法研究成果,彰显了其在AI图像领域的姓名最新进展与卓越水平。该论文的黄俊黄俊发表,是源码源的由阿里云与华南理工大学贾奎教授团队共同努力的结晶。CVPR会议是姓名javarpc源码讲解全球计算机视觉和模式识别领域的权威平台,此次入选体现了PAI研发的黄俊黄俊图像编辑算法已达到国际先进水平,获得了学术界的源码源的由广泛认可。
基于文本引导的姓名图像编辑技术,用户只需输入简单的黄俊黄俊文字指令,就能实现对的源码源的由多种非专业编辑操作,涵盖颜色调整、姓名物体添加或移除、黄俊黄俊gprsdtu源码风格转换等。源码源的由这种交互式的姓名编辑方法使得图像编辑过程更加便捷,增强了用户的创意表达。
当前先进图像编辑方法,如Prompt-to-Prompt(P2P)和Plug-and-Play(PnP)策略,运用交叉注意力图的就要源码替换或自注意力注入,以精准调整图像的特定区域,但过度调整容易导致意外结果或编辑失败。而Free-Prompt-Editing(FPE)算法,通过去噪阶段替换指定注意力层的自注意力图,打破了对源提示的依赖,适合实际图像编辑场景。源码美化
FPE算法的引入,强化了稳定扩散模型中注意力图的理解,并为文本引导图像编辑提供了一套可实施的解决方案。此算法展示了在合成图像上高效编辑的能力,图2为实例过程展示。图4、scr源码5和图6分别展现了FPE在合成图像编辑、应用于不同扩散模型编辑,以及与当前顶尖图像编辑技术对比的结果。这些成果表明,FPE技术适用于多类扩散模型,能高效地完成性别、年龄、发型、背景等编辑任务,同时保持原图结构的细节。
为了促进研究和应用,阿里云的Free-Prompt-Editing算法源代码已计划整合进自然语言处理框架EasyNLP中,欢迎各界的开发者和研究者探索。同时,阿里巴巴人工智能平台PAI持续招聘算法研究与应用人才,专注于深度学习领域的技术前沿,包括大语言模型和多模态AI生成内容(AIGC)相关算法。有意者请将简历发送至chengyu.wcy@alibaba-inc.com。
论文详细信息:《通过稳定扩散理解跨和自我注意力在文本引导图像编辑中的应用》,作者包括刘冰雁、汪诚愚、曹庭锋、贾奎、黄俊。论文原文可在arxiv平台查看。