1 from common import MyRequests,LoggerUntil,handle_exception 2 3 myRequests.update_headers({ \'Accept\':\'text/javascript\',}) ##这个地方加入accept了,主要是在邮件提取那里,不加入这个返回的是xml格式,加入后返回json格式,这样在提取方面更容易一些。 4 url = \'https://mail.163.com/entry/cgi/ntesdoor?funcid=loginone&language=-1&passtype=1&iframe=1&product=mail163&from=web&df=email163&race=-2_262_-2_hz&module=&uid={0}&style=-1&net=t&skinid=null\'.format(\'13148804507@163.com\') 5 datax = { 6 \'username\':\'13148804507@167.com\', 7 \'url2\':\'\', 8 \'savalogin\':\'0\', 9 \'password\':\'123456789abcd\', 10 } 11 12 text= myRequests.post(url,data = datax) 13 #到这一步已经登录ok了,可以打印cookie看看就能知道了。 14 15 16 抓取邮件, 17 请求完成后,打印text 得到 19 <html><head><script type="text/javascript">top.location.href = "?sid=iCApYbICzSWVFIFqHTCCdtntXqDYrVhB&df=email163";</script></head><body></body></html> 20 21 sid =re.search(\'sid=(.*?)&\',resp.text).group(1) #使用正则把sid取出来 22 url = \'?sid={sid}&func=mbox:listMessages&LeftNavfolder1Click=1&mbox_folder_enter=1\'.format(sid=sid) 23 datax = {\'var\':\'<?xml version="1.0"?><object><int>1</int><string>date</string><boolean>true</boolean><int>20</int><int>0</int><boolean>false</boolean><string>top</string><boolean>true</boolean><boolean>true</boolean></object>\'} 24 print myRequests.post(url, data=datax) 25 26 #这样就打印出所有邮件了。然后筛选邮件,找出与信用卡相关的邮件,做征信风控用。
python登录网易163邮箱,爬取邮件
内容版权声明:除非注明,否则皆为本站原创文章。