【多模态】DALL·E 2 笔记

文章来源:https://blog.csdn.net/qq_18846849/article/details/126306091

本文分类：news
发布日期：2025/1/23 21:13:31
本文链接：http://www.trdm.cn/news/393028.html

2022年32篇最佳AI论文：DALL·E 2、Stable Diffusion、ChatGPT等入选

Mila在读博士Louis Bouchard总结的论文列表，总体比较靠谱。GitHub上还有很多论文的短视频和文字解读、代码链接等。下面的列表我们添加了论文的主要贡献机构（有些机构虽然有贡献但排名较后有挂名嫌疑的，都被忽略不计了）&#xf…

建站知识 2024/12/6 15:28:31

DALL-E-2 论文水记

DALL-E-2 论文水记模型示意图虚线上面是 CLIP 的训练流程虚线下面是文字生成图像的流程。我们有一个 prior 模型和一个 decode 模型。先把 text embeding 输入 prior 模型，得到 image embeding，再把 image embeding 输入 decoder ，得到…

建站知识 2024/10/12 2:43:52

论文笔记：DALL-E2：Hierarchical Text-ConditionalImage Generation with CLIP Latents详解

论文:https://cdn.openai.com/papers/dall-e-2.pdf 代码：https://github.com/lucidrains/DALLE2-pytorch 摘要像CLIP这样的对比模型已经被证明可以学习稳健的图像表征，这些特征可以捕捉到语义和风格。为了利用这些表征来生成图像，我们提出了…

建站知识 2024/10/13 1:59:09

理解DALL·E 2， Stable Diffusion和 Midjourney工作原理

编者按：随着AIGC的兴起，各位小伙伴们对文生图工具DALL-E 2、Stable Diffusion和Midjourney一定并不陌生。本期IDP Inspiration，小白将和大家一同走进这三者背后的技术原理，一探究竟。以下是译文，Enjoy! 作者 | Arham…

建站知识 2024/11/8 16:21:16

关于OpenAI的DALL的一点使用心得

文章目录注册DALL使用根据描述来generate上传图片来generate也可以根据描述信息或者相似的图片来进行设计注册DALL https://openai.com/product/dall-e-2 使用根据描述来generate surprise me 自动生成描述（因为每个月只有15个免费credits，节省起…

建站知识 2025/1/18 22:43:52

独家 | 为DALL·E 2花了15美元创作这幅AI图像以后，我学到了……

作者：Joy Zhang 翻译：陈超校对：赵茹萱本文约3000字，建议阅读8分钟本文介绍了作者使用DALLE 2生成了美洲驼灌篮的逼真版图片的过程。是的，这是一只美洲驼灌篮。一份对DALLE 2封闭测试版试验的过程、限制以及学习内容…

建站知识 2024/10/26 5:28:57

DALL-E

CogView整体的算法框架与DALL-E相比更为简洁，文本部分的token转换已经十分成熟，下文不再做进一步介绍；图像则是通过一个离散化的AE(Auto-Encoder)转换为token。文本token和图像token拼接到一起之后输入到GPT模型中生成图像。最后在处理文本图…

建站知识 2025/1/17 10:51:27

DALL E2【论文阅读】

Hierarchical Text-Conditional Image Generation with CLIP Latents 1. Background 根据文本生成原创性图像，没有在训练集中出现过，学习特征然后进行组合根据文本对已有的图像进行编辑和修改，可以任意添加或移除已有物体（因为使…

建站知识 2024/11/3 6:59:14

相关文章