相关文章
简单理解HTTP协议
http协议又叫超文本传输协议,我们常用的网址http://指的就是这个东西。http协议是建立在TCP协议之上的,应用层的协议。那么我们来看看HTTP协议的内容都有哪些,我们可以使用网络调试助手,或直接在浏览器F12,网络窗口中查…
建站知识
2025/1/21 5:51:31
简易http服务器的搭建
简易http服务器的搭建
想要通过浏览器访问一个网页,就需要在浏览器中输入地址、转到,这就是由浏览器对服务器发出的一个请求。在之前的对http协议的快速理解中我们已经知道了,发送和接收的内容。那么服务器在接收到请求后,对浏览…
建站知识
2025/1/14 0:23:41
Requests+正则表达式爬取猫眼电影(TOP100榜)
猫眼电影网址:www.maoyan.com 前言:网上一些大神已经对猫眼电影进行过爬取,所用的方法也是各有其优,最终目的是把影片排名、图片、名称、主要演员、上映时间与评分提取出来并保存到文件或者数据库,本人也是巩固知识进行练习,整理笔记方便阅读 获取单个网页 # 获取单个…
建站知识
2024/10/16 20:21:40
我和 HelloGitHub
我?
我是一个本科学历、无大厂经历,普通的 Python 程序员。
虽然是计算机专业,但是大学玩了四年(Dota)后,发现自己无一技能傍身,要饿死啦!偶然间接触了 Python 这门编程语言&#…
建站知识
2025/1/19 8:26:38
爬虫_抓取猫眼电影TOP100
import re
import requests
# import pymysql
from requests.exceptions import RequestException#1.请求一个单页内容拿到html
def get_one_page(url):try:#构建headersheaders{User-Agent:Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko)…
建站知识
2024/10/16 20:21:32
跟着老崔的录像写的爬虫猫眼top100电影爬虫
现在猫眼加了反爬虫了,所以加了headers。 试了一下只加User-Agent会出现验证码的问题,都拷过来加上,没事了。 试了一下注释掉cookie,发现也是可以的。 初次学习爬虫,太累了。
import json
import re
from multiproces…
建站知识
2024/11/18 23:52:55