先发送登录界面的 get 请求,在登录页面 HTML 里获取登录需要的数据(如果需要的话),然后结合账户密码,再发送 post 请求,即可登录成功。然后根据获取的 cookie信息,继续访问之后的页面。
第7题: 你遇到过的反爬虫的策略?BAN IP
BAN USERAGENT
BAN COOKIES
验证码验证
javascript渲染
ajax异步传输
等.......
后续面试问题你常用的反反爬虫的方案?
你用过多线程和异步吗?除此之外你还用过什么方法来提高爬虫效率?
有没有做过增量式抓取?
对Python爬虫框架是否有了解?
她专科学历
27岁从零开始学习c,c++,python编程语言
29岁编写百例教程
30岁掌握10种编程语言,
用自学的经历告诉你,学编程就找梦想橡皮擦
欢迎关注她的公众号,非本科程序员