js逆向解密之网络爬虫(2)

日期：2020-12-02 栏目：程序人生浏览：次

事实上，这个方案二才是我在出现未定义window对象异常后首先尝试的方法，不过因为往js代码中添加的js脚本有问题，以为行不通，所以请教前辈，得到了方案一。

方案二的思路和方案一类似，不过更加粗暴一些。不是因为没在浏览器执行，造成没有window对象吗？那我就模拟浏览器来执行。

在执行之前，同样要修改js脚本，在js文件末尾调用e方法，添加如下代码：

var a; var param = e(2,a); return param;

切记：不要放在任何函数里面，我之前就是因为将这段代码放在函数里头强制执行，导致的结果就是在浏览器里可以获取加密字符串，但是在Python中获取到的却是None。

模拟浏览器用的selenium和chrome的webDriver，代码如下：

from selenium import webdriver browser = webdriver.Chrome(executable_path='chromedriver.exe') with open('eleme.js', 'r') as f: js = f.read() print(browser.execute_script(js))

这个方法也是可以获得加密之后的字符串。

最后，有必要说一下的是，如果需要获取大量的x-uab，采用方案二效率会高一下，因为采用方案二的话，可以自打开一个浏览器（都调用一个webdriver对象），然后快速执行js，返回加密字符串。

4 总结

一次js逆向解密，算是完成了吧。但是也留下了一些问题：

（1）使用chrome断点调试时，js脚本都是压缩混淆之后的，通过chrome的pretty print功能（也就是说那对花括号）可以格式美化，但是，有的时候却会失败，就像下图，格式化后，还是一团糟：

js逆向解密之网络爬虫

这个问题耽搁了我很长时间，没法调试啊！

（2）在下js基础不行，很困惑为什么运行时，先通过o.getUA()调用e函数内的嵌套函数，然后e函数内部嵌套函数中调用e方法本身，这是什么操作？函数调用不都应该先外层函数，然后再调用嵌套函数吗？

（3）如果不适用浏览器执行js的方法，就只能替换window对象，这该如何操作？

（4）这个e函数有近4万行，一个加密函数这么多代码，我可不信，里面肯定很多事混淆视听用的，但我尝试调试追踪过，只能说混淆之后让我无从追踪，头晕。怎么才能简化这段脚本呢？

如果哪位前辈可以解惑，请一定告知，不胜感激！拜谢！

您可能感兴趣的文章:

转载注明出处：http://www.heiqu.com/fa08173a88c88c93ec6c0c02ff412bd2.html

js逆向解密之网络爬虫(2)

相关推荐