当前的位置: 首页 >> 财经要闻 > 内容

【当前独家】AI“新宠”!互联网巨头争相布局 仅需关键词即可作画

发布时间:2022-10-14 15:45:33 来源:上海证券报

仅需几个关键词,再花上几分钟等待,你就能获得一幅梵高风格的画作。更重要的是,这幅画作的版权属于你。

最近,AI作画技术成为艺术圈的火爆话题。过去几十年里,绘画艺术一直被视为AI难以逾越的天堑。不过如今,这一道屏障,或许也在经历如当初AI冲击围棋一样的挑战。


(资料图片仅供参考)

仅需关键词即可作画

“星空、开满红色玫瑰花的山坡、破旧的石头城堡、梵高风格、油画”,在输入这5个关键词描述仅仅几分钟后,记者就获得了一幅极具梵高浪漫主义风格的油画作品,乍一看还真与大家熟知的名作《星空》有几分神似。而这一切的创作者并非人类,而是具备深度学习功能的AI软件。

曾一度被人类视为“护城河”的艺术创造力,如今可能正被AI迎头赶上。上个月,在美国科罗拉多州博览会艺术比赛中,一幅名为《太空歌剧院》的作品经过评委层层挑选后,最终被确定为比赛的金奖作品。然而这幅作品并非出自人类之手,而是一位游戏设计师用AI作画工具Midjourney(中途)创作的。而这也引发艺术圈极大的争论。

就在Midjourney走红后,国内也涌现了大量的AI作画平台。值得一提的是,在今年世界人工智能大会上,百度推出的“文心”平台也包含了AI作画功能。彼时,百度CEO李彦宏表示:“过去一年,无论是在技术层面还是在商业应用层面,人工智能都有了巨大的进展,有些甚至是方向性的改变。之所以说有方向性的改变,这里指的是AI从理解语言,理解文字,理解图片和视频,走向了生成内容。”

从输入到输出,AI如今正在从量变走向质变。自2015年,谷歌推出可以运用AI完成简单图像生成的程序后,如今技术再次迎来重要创新。

“这次最引起业内注意的其实是Stable Diffusion模型的出现,它解决了此前谷歌Disco Diffusion模型在绘制人脸上的不足。”一位资深程序员告诉记者,人脸绘制要求极高,相似度过低会导致“恐怖谷”效应,因此一直以来模型都无法很好解决。如今,能够绘制人脸,意味着AI作画应用场景大大拓宽,而这也是多模态预训练领域的一次可贵突破。

“人工智能多模态的预训练其实不是什么新鲜事物了。”一位业内工程师告诉记者,所谓多模态指的是在人工智能的训练模型中,将文字、图像、声音等若干不同类型的信息要素协同融合,比如AI作画实际上就是将文本语义转化为视觉图像的过程。“其实像大家熟悉的语音转文字,也是一种多模态预训练的人工智能。”

由于这类AI作画本质上都是基于这些开源模型建构的“训练项目”,开发门槛并不高,因此近两个月来,国内也涌现了大量的AI作画平台。仅在微信小程序上以“AI作画”为关键词搜索,就能发现超过20款相关程序。

关键词:
推荐阅读

Copyright   2015-2022 财报分析网版权所有  备案号:京ICP备12018864号-25   联系邮箱:29 13 23 6 @qq.com