相关文章
猫眼电影爬虫(参考崔大的书写的)
import json #json会将字典类型转化为字符串类型,利于保存 import requests #调用requests库发起get请求 import socket #与urlerror类型有关的库,与url库有关,本例没有用到。 from requests import RequestException #request异常的库 i…
建站知识
2024/10/23 7:18:57
爬虫学习日记1-豆瓣top250电影信息爬取
爬虫学习日记1-豆瓣top250电影信息爬去
学习任务:结合requests、re两者的内容爬取https://movie.douban.com/top250里的内容, 要求抓取名次、影片名称、年份、导演等字段。
一、代码部分 import requests
import re
import pickle
import timeheaders …
建站知识
2024/11/2 18:57:18
使用xpath匹配猫眼top100标题名(萌新简化版)
米娜桑,之前我们使用了正则匹配猫眼top100是不是感觉意犹未尽呢,这次我们来使用xpath匹配标题,为简化表示,这次只提取top100的标题。 思路分析:
1、首先对猫眼top100网页进行请求,老样子,把hea…
建站知识
2024/11/2 13:41:36
爬虫豆瓣TOP250电影数据
今天是开通博客的第一天 目的记录爬取豆瓣TOP250电影数据 目的
我写博客的目的很简单,主要是想记录一些自己学习python的历程,后期包括一些其他方面的学习,目前在看唐松老师写的《Python网络爬虫,从入门到实践》这本书࿰…
建站知识
2024/11/2 21:39:41
【JAVA爬虫】爬取猫眼电影TOP100并将数据存入数据库
前几天的简单写了个利用JSOUP进行JAVA爬虫,里面有谈到后续版本会更新数据库操作,所以这次来更新了。
版本更新
此次的版本里数据爬取部分新增了[电影主演-star]和[电影评分-score]部分,并对之前的数据提取进行了筛选和优化。 功能部分新增【…
建站知识
2024/10/24 16:12:56
Datawhale--组队学习第12期--python爬虫基础学习---task0/task1环境配置和网页请求基础
先修知识:task0(基本类库安装,git,anaconda,文本处理) Task0(前置):需要自己安装有关环境,学习git(b站),下载有关driver Chromedriver 作用 驱动浏览器(一个驱动程序,配…
建站知识
2024/10/23 14:27:16
《寄生虫》横扫奥斯卡,Python告诉你这部电影到底好在哪儿?
作者:吃一筐柠檬的C君 来源:CDA数据分析师 【导语】:今天我们横扫本届奥斯卡的韩国电影《寄生虫》,Python技术部分可以直接看第四部分。 今年的第92届奥斯卡可谓是大片云集,入围的影片不仅艺术性极高,而且市…
建站知识
2024/10/23 18:45:24