python urllib库有什么用

说明

1、urllib的request模块可以非常方便地抓取URL内容。

即将GET请求发送到指定页面,然后返回HTTP响应。

2、urllib使用程序执行各种HTTP请求。想模拟浏览器来完成特定的功能,需要将请求伪装成浏览器。

伪装方法是先监控浏览器发出的请求,然后根据浏览器的请求头进行伪装,User-Agent头是用来识别浏览器的。

实例

from urllib import request
import json
 
with request.urlopen('https://yesno.wtf/api') as f:
    data = f.read()
    print('Status: ', f.status, f.reason)
    # for k, v in f.getheaders():
    #     print('%s : %s' % (k, v))
    print('Data: ', data.decode('utf-8'))
    if f.status == 200:
        jsonData = json.loads(data.decode('utf-8'))
        print('JsonData Answer: ', jsonData['answer'])

python操作xml的两种方法:说明1、DOM会将整个XML读入内存,解析为树,所以占用内存大,解析慢。它的优点是可以随意遍历树的节点。2、SAX是一种流模式,边读边分析,占用内存小,分析快,缺点是需要自己处理事件。一般情况下,SAX优先 ...