相关文章
x264编码详细文字全过程
x264编码详细文字全过程 (1) x264_param_default( x264_param_t *param ) 作用: 对编码器进行参数设定 cqm:量化表相关信息 csp: 量化表相关信息里的memset( param->cqm_4iy, 16, 16 ); memset( param->cq…
建站知识
2025/1/17 14:07:47
深入学习使用ocr算法识别图片中文字的方法
公司有个需求,简单点说需要从一张图片中识别出中文,通过python来实现,当然其他程序也行,只要能实现,而小编主要学习python,所以就提了python。一个小白在网上遨游了一天,终于找到一丝丝思绪&…
建站知识
2024/11/10 7:31:56
基于torch学汪峰写歌词 聊天机器人 图像着色/生成 看图说话 字幕生成
分享一下我老师大神的人工智能教程!零基础,通俗易懂!http://blog.csdn.net/jiangjunshow 也欢迎大家转载本篇文章。分享知识,造福人民,实现我们中华民族伟大复兴! 手把手教你基于torch玩转 学汪峰写词、自动聊天机器人、图像着色、图像生成、看图说话…
建站知识
2025/1/27 2:55:55
【Keras+计算机视觉+Tensorflow】OCR文字识别实战(附源码和数据集 超详细必看)
需要源码和数据集请点赞关注收藏后评论区留言私信~~~ 一、OCR文字识别简介
利用计算机自动识别字符的技术,是模式识别应用的一个重要领域。人们在生产和生活中,要处理大量的文字、报表和文本。为了减轻人们的劳动,提高处理效率,从…
建站知识
2025/1/20 10:49:13
基于torch学汪峰写歌词、聊天机器人、图像着色/生成、看图说话、字幕生成
手把手教你基于torch玩转 学汪峰写词、自动聊天机器人、图像着色、图像生成、看图说话、生成字幕 作者:骁哲、李伟、小蔡、July。说明:本教程出自七月在线助教团队、及七月在线深度学习在线班学员之手,有何问题欢迎加Q群交流:4728…
建站知识
2025/2/25 14:46:16
远比系统看图更好的图片浏览器Honeyview,Picasa
大家应该都知道Windows系统自带的看图是非常单调的,几乎没有什么功能,而我们在日常生活中需要处理非常多的和图形有关的任务,很显然,系统自带的看图并不能帮我们解决问题。
为了更好的对图片进行处理,我们都会需要别的…
建站知识
2025/2/19 17:08:47
【PyTorch实战】图像描述——让神经网络看图讲故事
图像描述——让神经网络看图讲故事 1. 图像描述介绍2. 数据2.1 数据介绍2.2 图像数据处理2.3 数据加载 3. 模型与训练3. 实验结果参考资料 Image Caption: 图像描述,又称为图像标注,就是从给定的图像生成一段描述文字。图像描述是深度学习中十分有趣的一…
建站知识
2024/10/12 13:05:42
Transformer与看图说话
本项目来使用Transformer实现看图说话,即Image Caption任务。相关涉及的知识点有:迁移学习、EfficientNet、Transformer Encoder、Transformer Decoder、Self-attention。 项目效果如下: 文章末尾也展示了预测失败的时候
Image Caption:
让…
建站知识
2025/3/2 6:22:22