Python 爬虫从入门到进阶之路(三)

在说 Get 和 Post 请求之前,我们先来看一下 url 的编码和解码,我们在浏览器的链接里如果输入有中文的话,如:https://www.baidu.com/s?wd=贴吧,那么浏览器会自动为我们编码成:https://www.baidu.com/s?wd=%E8%B4%B4%E5%90%A7,在 Python2.x 中我们需要使用 urllib 模块的 urlencode 方法,但我们在之前的文章已经说过之后的内容以 Python3.x 为主,所以我们就说一下 Python3.x 中的编码和解码。

在 Python3.x 中,我们需要引入 urllib.parse 模块,如下:

1 import urllib.parse 2 data= {"kw":"贴吧"} 3 # 通过 urlencode() 方法,将字典键值对按URL编码转换,从而能被web服务器接受。 4 data = urllib.parse.urlencode(data) 5 print(data) # kw=%E8%B4%B4%E5%90%A7 6 # 通过 unquote() 方法,把 URL编码字符串,转换回原先字符串。 7 data = urllib.parse.unquote(data) 8 print(data) # kw=贴吧

内容版权声明:除非注明,否则皆为本站原创文章。

转载注明出处:https://www.heiqu.com/wsfpdf.html