有个任务需要抽取pdf中的图片,于是找了一个例子但是有错误,仅此记录下
错误1、 AttributeError: \'Document\' object has no attribute \'getObjectString
解决方法:getObjectString 改成 _getXrefLength
错误2、无法运行下面的程序(运行没有抽取图片)
解决方法:如果你的pdf仅仅只是由图片组成可能不会抽取到图片,我查看了打印的信息
发现没有object这个属性,但是可以看出这是一个图片的,所以只要修改部分代码就可以
if not isXObject or not isImage:
修改为
if not isImage:
或者修改为
if isImage==None