使用Python的urllib模块进行URL解析与请求处理
1、 Python的urllib库包含四个主要部分:用于请求网页的request模块,处理异常的error模块,解析URL地址的parse模块,以及检查网站robot协议的robotparser模块。
2、 打开Python文件,导入urllib中的解析模块。
3、 利用urlparse()函数对网址进行解析,识别并拆分各组成部分。
4、 程序运行后,网址将被分割为六种不同格式输出。
5、 将中文文本转为URL编码格式,并把部分链接以中文形式呈现。
6、 将URL编码转换为中文,与前述操作相反,实现编码到中文字符的还原。
7、 总结:
8、 使用urllib模块需明确各方法的实际功能,理解其本质才能正确灵活应用。
评论
更多评论