python urllib库有什么用
说明
1、urllib的request模块可以非常方便地抓取URL内容。
即将GET请求发送到指定页面,然后返回HTTP响应。
2、urllib使用程序执行各种HTTP请求。想模拟浏览器来完成特定的功能,需要将请求伪装成浏览器。
伪装方法是先监控浏览器发出的请求,然后根据浏览器的请求头进行伪装,User-Agent头是用来识别浏览器的。
实例
from urllib import request import json with request.urlopen('https://yesno.wtf/api') as f: data = f.read() print('Status: ', f.status, f.reason) # for k, v in f.getheaders(): # print('%s : %s' % (k, v)) print('Data: ', data.decode('utf-8')) if f.status == 200: jsonData = json.loads(data.decode('utf-8')) print('JsonData Answer: ', jsonData['answer'])
python操作xml的两种方法:说明1、DOM会将整个XML读入内存,解析为树,所以占用内存大,解析慢。它的优点是可以随意遍历树的节点。2、SAX是一种流模式,边读边分析,占用内存小,分析快,缺点是需要自己处理事件。一般情况下,SAX优先 ...