相关文章
ChatGLM LoRA微调定制AI大模型
一、前言
对于 ChatGLM2-6B 模型基于 PEFT 的特定任务微调实验。
1.1 硬件需求 注:r 为LoRA 维数大小,p 为前缀词表大小,l 为微调层数,ex/s 为每秒训练的样本数。gradient_accumulation_steps 参数设置为 1。上述结果均来自于单个 Tesla V100 GPU,仅供参考。 1.2 微调方…
建站知识
2024/11/17 1:20:00
屏幕分辨率dpi解析(adb 调试查看)
authordaisy.skye的博客_CSDN博客-嵌入式,Qt,Linux领域博主 ro.sf.lcd_density属性指定了这个机型使用的dpi是多少,dpi全称是dots per inch,对角线每英寸的像素点的个数。 密度 ldpi mdpi hdpi xhdpi xxhdpi 分辨率 240x320 320x480 480x800 7…
建站知识
2024/10/28 2:27:09
Android Edittext 实现输入小写字母显示大写字母
可以使用setFilters方法配合InputFilter来实现这个功能
以下是一个简单的例子:
EditText editText (EditText) findViewById(R.id.edit_text);
InputFilter filter new InputFilter() {public CharSequence filter(CharSequence source, int start, int end, Sp…
建站知识
2024/11/24 16:57:33
Redis 面试常见问答
本文出自:https://thinkinjava.cn 作者:莫那 鲁道 1. 什么是缓存雪崩?怎么解决? 一般而言,我们会利用缓存来缓冲对数据库的冲击,假如缓存无法正常工作,所有的请求便会直接发送至数据库…
建站知识
2024/10/29 2:47:59
数据结构与算法之复杂度
时间复杂度
1.抓大头 2.常数用o(1),低阶函数也用o(1)代替(直接去掉) 3.取最坏情况 对数相关写法的规定
建站知识
2024/10/29 22:44:06
Linux系统100条命令:关于Ubuntu和 CentOS 7 相同功能的不同的终端操作命令
安装软件包:
Ubuntu:apt-get install package_name CentOS 7:yum install package_name
更新软件包列表:
Ubuntu:apt-get update CentOS 7:yum update
卸载软件包:
Ubuntu:apt-…
建站知识
2024/10/29 9:19:23
transformer系列2---transformer架构详细解析
transformer详细解析 Encoder1 输入1.1 Embedding 词嵌入1.1.1 Embedding 定义1.1.2 几种编码方式对比1.1.3 实现代码 1.2 位置编码1.2.1 使用位置编码原因1.2.2 位置编码方式1.2.3 位置编码代码 2 注意力 Attention2.1 自注意力self-attention2.1.1 QKV含义2.1.2 自注意力公式…
建站知识
2024/11/7 12:23:30