bucuo123 发表于 2019-3-20 21:59:00

使用dedecms自带采集功能的文字过滤与替换的方法

使用dedecms自带采集功能的文字过滤与替换的方法
            
        1.去除超链接,这种最常用。
        {dede:trim replace=”},*)>{/dede:trim}
        {dede:trim replace=”}{/dede:trim}
        如果填成这样,那就把链接的文本也一起去掉了
        {dede:trim replace=”},*)>(.*){/dede:trim}
        2.过滤JS调用广告,比如GG的广告,就加个这样的:
        {dede:trim replace=”}{/dede:trim}
        3.过滤div标签。
        这个很重要,如果没过滤干净则可能使发布出来的文章版面错位, 目前大多数遇到采集后错位的原因在此。
        {dede:trim replace=”}{/dede:trim}
        {dede:trim replace=”}{/dede:trim}
        有的时候也需要这样子过滤:
        {dede:trim replace=”}(.*){/dede:trim}
        4.其它的过滤规则可以照以上规律进行推出。
        5.过滤摘要和关键字使用,经常要用到。
        {dede:trim replace=”}{/dede:trim}
        6.简单替换。
        {dede:trim replace=’替换后的词语’}要替换的词语{/dede:trim}
        采集的内容当然也要求搜索引擎收录, 过滤和替换目的是减少重复,进行伪原创,如何具体的操作,就看个人的要求与喜好了。
页: [1]
查看完整版本: 使用dedecms自带采集功能的文字过滤与替换的方法