AIGC(AIGeneratedContent)即人工智能生成内容。近期爆火的AI聊天机器人ChatGPT,以及Dall·E2、StableDiffusion等文生图模型,都属于AIGC的典型案例,它们通过借鉴现有的、人类创造的内容来快速完成内容创作.
“新晋流量”ChatGPT的背后,AIGC是“昙花一现”?还是将引领人工智能进入新的时代?「AIGC周报」将从带你快速跟进AIGC世界。
一、技术前瞻
1.ChatGPT:这一次,我问你答
提出有洞察力的问题,对于获取知识和扩展机器对世界的理解至关重要。然而,在AI研究中,提问的重要性在很大程度上被忽视了。随着ChatGPT等大型语言模型的快速发展,它们被证明可以在提供合适的提示(prompt)时提出高质量的问题。这一发现为开发自动提问系统提供了新的机会。
该研究介绍了一种新颖的图像字幕自动提问方法——ChatCaptiter:ChatGPT被提示向视觉问答模型BLIP-2询问一系列关于图像的问题,通过不断从BLIP-2的回答中获取新的视觉信息,其能够生成更丰富的图像描述。
具体来说,ChatCaptainer从一个任务指令开始,设置文本并概述ChatGPT的问题;当收到来自BLIP-2的答案时,便将聊天日志和问题说明提示给ChatGPT,以继续询问信息获取问题;最后,为ChatGPT提供一个图像说明并结束对话。
该研究对常见的图像标题数据集(如COCO、ConceptiveCaption和WikiArt)进行了人类主体评估,并将ChatCaptainer与BLIP-2以及人工标注框比较。
结果表明,ChatCaptioner的字幕提供的信息要多得多,其从人类评估者那里获得的选票是BLIP-2的三倍;通过WordNet同义词集匹配测量,ChatCaptioner比BLIP-2多识别了53%的图像中的物体。
论文链接: