许多朋友在采集的时候会遇到这样的问题,一些网站上的文章来源里会出现两个甚至多个来源媒体,这样就很不容易写文章来源的匹配规则,而且许多来源都是有链接的,这样又增加了写匹配规则的难度,在这种情况下,我们很有必要为所有的采集文章指定一个固定的文章来源
具体方法如下:
在采集规则写好后,点击“更改配置”,在字段配置可以找到这段代码:
{dede:item field='source' value='' isunit='' isdown=''}
{dede:match}{/dede:match}
{dede:trim}<a([^>]*)>{/dede:trim}
{dede:trim}</a>{/dede:trim}
{dede:function}{/dede:function}
{/dede:item}
在这里我们可以给source的value附一个值,比如"织梦论坛",修改后的代码如下:
{dede:item field='source' value='织梦论坛' isunit='' isdown=''}
{dede:match}{/dede:match}
{dede:trim}<a([^>]*)>{/dede:trim}
{dede:trim}</a>{/dede:trim}
{dede:function}{/dede:function}
{/dede:item}
这样修改,就可以将所有采集到的文章的来源固定为“织梦论坛”了。
但是有些朋友还有些特殊的要求,需要为这个来源添加一个链接,还是很简单的,只需把value的值改成
<a href=http://www.dede58.com/"http:/bbs.dedecms.com">织梦论坛</a>
但是在默认的情况下,文章内容页中的文章来源是不会显示的,因为数据库中对source的长度做了限制,只要进入数据库中找到表dede_archives 修改source的长度就可以了
采集数据导入完成后,找到采集-批量维护-自动摘要/分页,然后[开始执行]就可以自动采集文章摘要了,最后更新一下HTML就OK 了