此方法适用于使用火车头采集器更新的站点

 

PHP插件代码:

 

<?php
error_reporting(E_ERROR | E_WARNING | E_PARSE);

// 敏感词过滤
$sensitiveWordsFile = 'E:\Locoy\Plugins\words.txt'; // 敏感词列表文件路径
$sensitiveWords = file($sensitiveWordsFile, FILE_IGNORE_NEW_LINES | FILE_SKIP_EMPTY_LINES);

$str = $LabelArray['标题'];
foreach ($sensitiveWords as $word) {
    if (strpos($str, $word) !== false) {
        $str = '';
        break;
    }
}
$LabelArray['标题'] = $str;
// 敏感词过滤 end

echo serialize($LabelArray);

?>

说明,此方法会检测采集到的标题是否包含 E:\Locoy\Plugins\words.txt 文档中的敏感词,如果包含敏感词,则替换标题字段的值为空

 

 

声明:本站所有文章,如无特殊说明或标注,均为本站原创发布。任何个人或组织,在未征得本站同意时,禁止复制、盗用、采集、发布本站内容到任何网站、书籍等各类媒体平台。如若本站内容侵犯了原著者的合法权益,可联系我们进行处理。