又面试了Python爬虫工程师,碰到这么几道面试题,Python面试题No9 (2)

先发送登录界面的 get 请求,在登录页面 HTML 里获取登录需要的数据(如果需要的话),然后结合账户密码,再发送 post 请求,即可登录成功。然后根据获取的 cookie信息,继续访问之后的页面。

第7题: 你遇到过的反爬虫的策略?

BAN IP

BAN USERAGENT

BAN COOKIES

验证码验证

javascript渲染

ajax异步传输

等.......

后续面试问题

你常用的反反爬虫的方案?

你用过多线程和异步吗?除此之外你还用过什么方法来提高爬虫效率?

有没有做过增量式抓取?

对Python爬虫框架是否有了解?

她专科学历
27岁从零开始学习c,c++,python编程语言
29岁编写百例教程
30岁掌握10种编程语言,
用自学的经历告诉你,学编程就找梦想橡皮擦

欢迎关注她的公众号,非本科程序员

内容版权声明:除非注明,否则皆为本站原创文章。

转载注明出处:https://www.heiqu.com/zyxfpw.html