今天在采集51cto的数据的时候出现了部分文章采集内容为空的情况,开始是不知道,因为采集600多文章,所以只看了开头两个,发现可以后就直接导入数据库了,遗憾的时候,导入后发现部分内容为空,也就是body段是空的,600多条数据,要一个一个找,很麻烦,所以dede58就找到一个简单方法:
在后台执行如下sql语句
1
delete dede_addonarticle,dede_archives FROM dede_addonarticle,dede_archiveswhere dede_addonarticle.body='' and dede_addonarticle.aid=dede_archives.id