python爬取网站万张美女、风景..等图片
2023-12-28 15:24:58
?这是该站主页?https://pic.netbian.com/
首先右键主页空白处
?然后点击鼠标点击的位置?
?下面代码运行效果,按住ctrl c即可停止下载
?下面是代码内容和解析
"""请求网页"""
import requests
import re
import time
header = {
'User-Agent': 'Mozilla/5.0 (Windows NT 10.0; Win64; x64; rv:76.0) Gecko/20100101 Firefox/76.0'
}
for page in range(1, 11):
url = f'https://pic.netbian.com/4kmeinv/index_{page}.html'
response = requests.get(url, headers=header)
html = response.text
"""解析网页"""
urls = re.findall('target="_blank"><img src="(.*?)"', html)
for url in urls:
time.sleep(1)
url = "http://pic.netbian.com" + url
print(url)
file_name = url.split("/")[-1]
response = requests.get(url, headers=header)
with open(f'page{page}_{file_name}', 'wb') as f:
f.write(response.content)
f.close()
print('爬取完成!')
首先,导入requests
和re
模块。然后设置请求头header
,模拟浏览器访问。接下来使用循环遍历1到10的页数,构造每一页的URL。发送GET请求获取网页内容,保存在变量html
中。
接下来是解析网页的部分。使用正则表达式re.findall
匹配图片的URL,并保存在列表urls
中。然后对每个URL进行处理,加上网站的域名。接着是获取图片的文件名,并使用requests.get
请求图片的URL。最后,使用open
函数以二进制写入模式打开文件,将图片内容写入文件中。
在循环内部,使用time.sleep
函数暂停1秒,避免过快爬取导致封IP。最后输出爬取完成的提示信息。
这段代码解析只是展示了爬取网页和图片的基本思路,实际使用时可能需要进行异常处理、页面跳转等操作。
直接复制就可运行
如果想换类型图片可到网站换类型将网址复制到url中即可,页数也可以更改
如有什么问题可以互动我看到会回复大家问题,作者不易给个点赞关注
文章来源:https://blog.csdn.net/yuwenduo123/article/details/135257002
本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。 如若内容造成侵权/违法违规/事实不符,请联系我的编程经验分享网邮箱:veading@qq.com进行投诉反馈,一经查实,立即删除!
本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。 如若内容造成侵权/违法违规/事实不符,请联系我的编程经验分享网邮箱:veading@qq.com进行投诉反馈,一经查实,立即删除!