相关文章
LLM - Baichuan7B Tokenizer 生成训练数据
目录 一.引言
二.Tokenizer 原始数据
1.原始数据样例
2.加载并 Token 原始数据
2.1 参数准备
2.2 单条样本处理逻辑
2.3 批量处理逻辑
2.4 主函数与完整代码
三.shell 执行
四.总结 一.引言
前面提到了自己在微调 Baichuan7B Lora 的过程中遇到了一些问题,…
建站知识
2024/11/2 2:20:10
爬虫之Scrapy框架爬取彼岸壁纸案例分享
爬虫之Scrapy框架爬取彼岸壁纸案例分享
前段时间在网上看到有人爬取了彼岸壁纸的案例,由于爬取的图片较多,爬取速度感觉不快,所以就自己写了个Scrapy框架,个人觉得爬取速度快多了。 代码如下。 文章目录 爬虫之Scrapy框架爬取彼岸…
建站知识
2024/11/2 2:35:23
全套英雄联盟系列壁纸,确定不来了解一下?
前言 我曾踏足山巅,也曾跌落低谷,二者都让我受益良多 最近喜欢在文章前面加入联盟的壁纸,一是为了填充内容,不显得内容干燥,二是这些壁纸看起来确实很帅哈哈
于是花了点时间找了些LOL的壁纸网站,最终锁定了https://lolskin.cn/ 英雄联盟皮肤站,看了下这个站还是很不错的…
建站知识
2024/10/24 13:34:45
python随机爬取wallhaven壁纸url(获取随机图片url)
01 代码清单 class get_random_wallhaven(object):def __init__(self, url https://wallhaven.cc/random):self.init_url urldef getHTMLText(self, url):import urllib3headers {User -Agent : Mozilla/5.0 (Windows NT 10.0; WOW64) AppleWebKit/537.36 (KHTML, like Geck…
建站知识
2024/10/10 8:27:59
deepin切换壁纸小工具
切换壁纸小工具(python脚本)
切换壁纸这种事,找到接口,一行代码就可以解决,本来打算用bash脚本,但是考虑到随机选取壁纸等因素,用python的os模块完成任务。
一、思路 找到切换壁纸的接口设置壁纸库(文件夹)python脚本完成功能半小时自动切换壁纸二、实现过程
1、切…
建站知识
2024/10/24 16:50:39
JAVA爬虫---LOL各英雄图片(含皮肤)下载
pom依赖 <dependency><groupId>org.apache.httpcomponents</groupId><artifactId>httpclient</artifactId><version>4.5.2</version></dependency><dependency><groupId>com.alibaba</groupId><artifact…
建站知识
2024/10/8 5:24:57
利用Scrapy框架爬取LOL皮肤站高清壁纸
利用Scrapy框架爬取LOL皮肤站高清壁纸 Lan 2020-03-06 21:22 81 人阅读 0 条评论 成品打包:点击进入 代码: 爬虫文件 # -*- coding: utf-8 -*-
import scrapy
from practice.items import PracticeItem
from urllib import parseclass LolskinSpider(s…
建站知识
2024/10/24 19:53:04