打赏

相关文章

DALL·E:OpenAI第一代文本生成图片模型

1 简介 本文根据openAI 2021年2月的《Zero-Shot Text-to-Image Generation》翻译总结的。原文详见https://arxiv.org/pdf/2102.12092v1.pdf。 DALLE : 论文中没看到这个名字,可能是后起的吧。 DALLE有120亿参数,基于自回归transformer,在2…

读完 DALL-E 论文,我们发现大型数据集也有平替版

内容提要: OpenAI 团队的新模型 DALL-E 刷屏,这一新型神经网络,使用 120 亿参数,经过「特训」,任意描述性文字输入后,都可以生成相应图像。如今,团队将这一项目的论文和部分模块代码开源&#x…

【多模态】DALL·E 2 笔记

DALLE2 论文题目:《Hierarchical Text-Conditional Image Generation with CLIP Latents》(使用CLIP特征的 层次文本条件图像生成) DALLE 2 模型结构 首先训练一个 CLIP 模型,进行图片-文本对的对比学习,训练得到一…

DALL-E-2 论文水记

DALL-E-2 论文水记 模型示意图 虚线上面是 CLIP 的训练流程 虚线下面是文字生成图像的流程。我们有一个 prior 模型和一个 decode 模型。先把 text embeding 输入 prior 模型,得到 image embeding,再把 image embeding 输入 decoder ,得到…

理解DALL·E 2, Stable Diffusion和 Midjourney工作原理

编者按:随着AIGC的兴起,各位小伙伴们对文生图工具DALL-E 2、Stable Diffusion和Midjourney一定并不陌生。 本期IDP Inspiration,小白将和大家一同走进这三者背后的技术原理,一探究竟。 以下是译文,Enjoy! 作者 | Arham…

关于OpenAI的DALL的一点使用心得

文章目录 注册DALL使用根据描述来generate上传图片来generate也可以根据描述信息或者相似的图片来进行设计 注册DALL https://openai.com/product/dall-e-2 使用 根据描述来generate surprise me 自动生成描述(因为每个月只有15个免费credits,节省起…

手机版浏览

扫一扫体验

微信公众账号

微信扫一扫加关注

返回
顶部