相关文章
Python爬虫实践《流浪地球》豆瓣影评分析及实践心得
一段多余的话
多余的话不多说,我想聊聊在进行实践分析中遇到的困难与心得。下载jupyter进行分析的一些建议
我们安装juputer前,首先需要安装python,因为本人曾经上过自然语言处理课,所以已经安装完成(3.8版本&#x…
建站知识
2024/10/31 14:39:51
爬虫实战之《流浪地球》豆瓣影评分析(三)
4. 分析评论数量及评分与时间的关系
首先导入数据,进行一个初步的统计:
import pandas as pd
data pd.read_csv(doubanliulangdiqiu.csv,encoding GB18030)
data[评分].value_counts()可以看到这样的情况: 如果没有数据,可以去…
建站知识
2024/11/1 23:03:41
爬虫实战之《流浪地球》豆瓣影评分析(二)
3. 分析好评与差评的关键信息
依靠绘制词云图,来分析好评与差评的关键信息的区别
数据预处理
依靠上一篇爬取到的csv文件,来进行分析,首先导入文件,重点是短评正文的信息。 首先是使用结巴库来进行分词,然后去除停用…
建站知识
2024/10/30 9:28:53
爬虫实战之《流浪地球》豆瓣影评分析(一)
背景与挖掘目标获取豆瓣评论数据分析好评与差评的关键信息分析评论数量及评分与时间的关系分析评论者的城市分布情况
1. 背景与挖掘目标 豆瓣(douban)是一个社区网站。网站由杨勃(网名“阿北”) 创立于2005年3月6日。该网站以书影…
建站知识
2024/10/27 18:03:19
《流浪地球》影评数据爬取分析
《流浪地球》影评数据爬取分析
人生苦短,我用Python。
阿巴阿巴阿巴,爬虫初学者,志在记录爬虫笔记,交流爬虫思路。 话不多说,开始进行操作。 对于电影数据影评的爬取,这里选取的网站是豆瓣网(…
建站知识
2024/11/2 7:22:44
650亿参数,训练飙升38%!LLaMA基础大模型复刻最佳实践开源,GitHub已获30k星
开源LLaMA神话再次复现!首个开源650亿参数大模型高性能预训练方案,训练加速38%,低成本打造量身大模型。
「百模大战」正风起云涌,AIGC相关企业融资和并购金额也屡创新高,全球科技企业争相入局。
然而,AI大…
建站知识
2024/11/2 17:54:34
AI炒股:用Claude来分析A股2023年中报业绩预告
Claude是和ChatGPT类似的AI大模型,据测试 AI 的水平能力接近 GPT-4,支持高达 100K token 的上下文。Claude只需要到官方网站注册账号后就可以直接免费使用。不过,目前智能美国和英国的 IP 可以注册和使用。
Claude支持上传文档功能ÿ…
建站知识
2024/11/2 13:17:19