DALL·E这波超进化,画质艺术感双飞升,还学会了无痕P图
作者:啊哈哈哈 来源:ai08门户网 时间:2025-07-17 09:32:11
把椅子上的萌犬P成猫猫,需要几步?
第一步,圈出狗狗。第二步,告诉AI你的需求。鼠标一点,齐活。
这位AI P图大师,其实是位老朋友——OpenAI风靡全球的那位DALL·E。
现在,它刚刚完成了“2.0超进化”。不仅新学了一手出神入化的P图绝技,创作质量也有了飞跃式的提升。
话不多说,直接看作品感受一下~
这是DALL·E 2在“星云爆炸状柯基头”这一提示下的创作出来的画作:
这幅萨尔瓦多·达利的画像,是不是有点萨尔瓦多·达利内味儿了?
跟初代DALL·E比起来,着实是画质与艺术感双双飞升了。
所以,研究人员具体如何点亮了DALL·E的新技能点?
DALL·E此番进化,简单来说就是分辨率更高了,延迟更低了。
此外,还有更新2大新功能:
首先,在更细粒度上实现文本→图像功能。
也就是说,DALL·E 2可以根据自然语言提示进行P图。在P图的过程中,还会考虑阴影、反射、纹理等元素的变化。
比如在左图标“2”的位置P一个火烈鸟泳圈,DALL-E 2会把水面倒影这种细节也处理到位。
其次,是可以在保留原作核心元素的基础之上,赋予原作船新的风格。
并且生成画面的画质是DALL·E 1的4倍,即从256×256提升到了1024×1024。
CLIP是原版DALL·E功能实现的基础,是一个负责给图像重排序的模型,其零样本学习能力已经在各种视觉和语言任务上大放异彩。
而扩散模型的特点在于,在牺牲多样性的前提下,能大大提升生成图像的逼真度。
于是,OpenAI的研究人员设计了这样一种方案:
在这个名为unCLIP的架构中,CLIP文本嵌入首先会被喂给自回归或扩散先验,以产生一个图像嵌入。
而后,这个嵌入会被用来调节扩散编码器,以生成最终的图像。
OpenAI解释称,DALL·E能够get图像和用于描述画面的文本之间的关系。其图像的生成是在“扩散”过程中完成的,可以理解为是从“一堆点”出发,用越来越多的细节去把图像填充完整。
研究人员将DALL·E 2与DALL·E、GLIDE等模型进行了对比。
实验结果显示,DALL·E 2的图像生成质量与GLIDE相当,但DALL·E的生成结果更具多样性。
目前,DALL·E 2并未对公众开放,不过如果你感兴趣,可以在线注册申请一发~
项目地址:https://openai.com/dall-e-2/#demos
— 完 —
“
更多资讯
热门文章
推荐对话
换一换- 人气排行
- 1 DALL·E这波超进化,画质艺术感双飞升,还学会了无痕P图
- 2 马斯克终结美国载人航天的“寄俄篱下”,SpaceX首次正式商业载人任务圆满成功
- 3 3纳米M3首发iMac/台积电拟招聘6千人/小鹏人脸识别需对车头半跪…今日更多新鲜事在此
- 4 OpenAI热钱投向造芯!押注一老一少半导体传奇组合,乔布斯和马斯克都曾赞不绝口
- 5 马斯克76岁父亲与继女生子,华强北又出一个芯片IPO,原蚂蚁副总投身AI制药,今日更多大新闻在此
- 6 人类刚给火星送去Linux系统,以及一款安卓手机芯片
- 7 秃如其来的希望!Nature新研究:多能干细胞能形成近乎完整皮肤结构,移植小鼠后成功长出毛发
- 8 NASA发布黑洞录音/ 任正非称华为要先活下来/ 重庆电网负荷创新高…今日更多新鲜事在此
- 9 NASA第一架电动飞机首飞在即,有哪些点值得你关注?
- 10 平均每天烧掉400万!首家上市航天公司交出财报:送70岁创始人上天是今年主要任务