在使用Python进行数据抓取的时候,有时候需要保持文件或图片等,在Python中可以有多种方式
在使用Python进行数据抓取的时候,有时候需要保持文件或图片等,在Python中可以有多种方式实现。今天就一起来学习下。
urllib.request
主要使用的是urlretrieve方法,该方法处理待淘汰的方法,不建议使用。
import urllib.request
url = 'https://www.baidu.com/img/superlogo_c4d7df0a003d3db9b65e9ef0fe6da1ec.png'
urllib.request.urlretrieve(url, './image/logo.png')
requests
相比上述方案,可以返回HTTP的meta信息。
import requests
r = requests.get(url)
with open('./image/logo.png', 'wb') as f:
f.write(r.content)
# Retrieve HTTP meta-data
print(r.status_code)
print(r.headers['content-type'])
print(r.encoding)
wget
wget是Linux下的一个命令行下载工具,在Python中可以直接通过安装包后使用。使用方法如下:
import wget
url = 'https://www.baidu.com/img/superlogo_c4d7df0a003d3db9b65e9ef0fe6da1ec.png'
wget.download(url, './image/logo.png')
以上就是本文的全部内容,希望对大家的学习有所帮助,也希望大家多多支持脚本之家。
Python 下载文件