DALL·E：用文本生成图像

文章来源:https://blog.csdn.net/weixin_51697828/article/details/119005821

本文分类：news
发布日期：2025/1/23 14:59:41
本文链接：http://www.trdm.cn/news/393031.html

DALL·E:OpenAI第一代文本生成图片模型

1 简介本文根据openAI 2021年2月的《Zero-Shot Text-to-Image Generation》翻译总结的。原文详见https://arxiv.org/pdf/2102.12092v1.pdf。 DALLE : 论文中没看到这个名字，可能是后起的吧。 DALLE有120亿参数，基于自回归transformer，在2…

建站知识 2024/10/17 6:41:48

读完 DALL-E 论文，我们发现大型数据集也有平替版

内容提要： OpenAI 团队的新模型 DALL-E 刷屏，这一新型神经网络，使用 120 亿参数，经过「特训」，任意描述性文字输入后，都可以生成相应图像。如今，团队将这一项目的论文和部分模块代码开源&#x…

建站知识 2024/12/11 18:21:30

【多模态】DALL·E 2 笔记

DALLE2 论文题目：《Hierarchical Text-Conditional Image Generation with CLIP Latents》（使用CLIP特征的层次文本条件图像生成） DALLE 2 模型结构首先训练一个 CLIP 模型，进行图片-文本对的对比学习，训练得到一…

建站知识 2025/1/7 12:10:24

2022年32篇最佳AI论文：DALL·E 2、Stable Diffusion、ChatGPT等入选

Mila在读博士Louis Bouchard总结的论文列表，总体比较靠谱。GitHub上还有很多论文的短视频和文字解读、代码链接等。下面的列表我们添加了论文的主要贡献机构（有些机构虽然有贡献但排名较后有挂名嫌疑的，都被忽略不计了）&#xf…

建站知识 2024/12/6 15:28:31

DALL-E-2 论文水记

DALL-E-2 论文水记模型示意图虚线上面是 CLIP 的训练流程虚线下面是文字生成图像的流程。我们有一个 prior 模型和一个 decode 模型。先把 text embeding 输入 prior 模型，得到 image embeding，再把 image embeding 输入 decoder ，得到…

建站知识 2024/10/12 2:43:52

论文笔记：DALL-E2：Hierarchical Text-ConditionalImage Generation with CLIP Latents详解

论文:https://cdn.openai.com/papers/dall-e-2.pdf 代码：https://github.com/lucidrains/DALLE2-pytorch 摘要像CLIP这样的对比模型已经被证明可以学习稳健的图像表征，这些特征可以捕捉到语义和风格。为了利用这些表征来生成图像，我们提出了…

建站知识 2024/10/13 1:59:09

理解DALL·E 2， Stable Diffusion和 Midjourney工作原理

编者按：随着AIGC的兴起，各位小伙伴们对文生图工具DALL-E 2、Stable Diffusion和Midjourney一定并不陌生。本期IDP Inspiration，小白将和大家一同走进这三者背后的技术原理，一探究竟。以下是译文，Enjoy! 作者 | Arham…

建站知识 2024/11/8 16:21:16

关于OpenAI的DALL的一点使用心得

文章目录注册DALL使用根据描述来generate上传图片来generate也可以根据描述信息或者相似的图片来进行设计注册DALL https://openai.com/product/dall-e-2 使用根据描述来generate surprise me 自动生成描述（因为每个月只有15个免费credits，节省起…

建站知识 2025/1/18 22:43:52

相关文章