相关文章
爬虫实战之《流浪地球》豆瓣影评分析(三)
4. 分析评论数量及评分与时间的关系
首先导入数据,进行一个初步的统计:
import pandas as pd
data pd.read_csv(doubanliulangdiqiu.csv,encoding GB18030)
data[评分].value_counts()可以看到这样的情况: 如果没有数据,可以去…
建站知识
2024/11/1 23:03:41
爬虫实战之《流浪地球》豆瓣影评分析(二)
3. 分析好评与差评的关键信息
依靠绘制词云图,来分析好评与差评的关键信息的区别
数据预处理
依靠上一篇爬取到的csv文件,来进行分析,首先导入文件,重点是短评正文的信息。 首先是使用结巴库来进行分词,然后去除停用…
建站知识
2024/10/30 9:28:53
爬虫实战之《流浪地球》豆瓣影评分析(一)
背景与挖掘目标获取豆瓣评论数据分析好评与差评的关键信息分析评论数量及评分与时间的关系分析评论者的城市分布情况
1. 背景与挖掘目标 豆瓣(douban)是一个社区网站。网站由杨勃(网名“阿北”) 创立于2005年3月6日。该网站以书影…
建站知识
2024/10/27 18:03:19
《流浪地球》影评数据爬取分析
《流浪地球》影评数据爬取分析
人生苦短,我用Python。
阿巴阿巴阿巴,爬虫初学者,志在记录爬虫笔记,交流爬虫思路。 话不多说,开始进行操作。 对于电影数据影评的爬取,这里选取的网站是豆瓣网(…
建站知识
2024/11/2 7:22:44
650亿参数,训练飙升38%!LLaMA基础大模型复刻最佳实践开源,GitHub已获30k星
开源LLaMA神话再次复现!首个开源650亿参数大模型高性能预训练方案,训练加速38%,低成本打造量身大模型。
「百模大战」正风起云涌,AIGC相关企业融资和并购金额也屡创新高,全球科技企业争相入局。
然而,AI大…
建站知识
2024/11/2 17:54:34
AI炒股:用Claude来分析A股2023年中报业绩预告
Claude是和ChatGPT类似的AI大模型,据测试 AI 的水平能力接近 GPT-4,支持高达 100K token 的上下文。Claude只需要到官方网站注册账号后就可以直接免费使用。不过,目前智能美国和英国的 IP 可以注册和使用。
Claude支持上传文档功能ÿ…
建站知识
2024/11/2 13:17:19
人人都能看懂的 ChatGPT 原理课:从 GPT1.0 到 ChatGPT,经历了什么?
目录
GPT 初代
GPT 的语言建模
语言模型的编解码
GPT-2
GPT-3
大模型中的大模型
建站知识
2024/11/2 17:37:41
我用ChatGPT搞懂GPT技术原理,只问了30个问题,这是极致的学习体验!
自己前段时间写了一篇文章《问了ChatGPT 上百个问题后,我断定ChatGPT可以重塑学习范式!》,讲了使用ChatGPT的感受,最近我开始学习GPT的技术原理,原因有三个: 1、工作中有可能要用到GPT,理解GPT的…
建站知识
2024/11/2 3:00:40