高铁采集器/火车头采集器PHP插件开发排除某个标签的重复值
如上图,在采集过程中,可能遇到需要排除重复数据的情况,但是火车头本身自带的功能又满足不了我们,以上情况就可以采集开发PHP插件的方法来排除拼音字段的重复值。
有点PHP基本的应该一看就会,废话不多说,上代码。
$PinYinArray = explode(',', $LabelArray['拼音']);
$UniquePinYinArray = array_unique($PinYinArray);
$UniquePinYin = implode(',', $UniquePinYinArray);
$LabelArray['拼音'] = $UniquePinYin;
解释一下:
先将拼音字符串按逗号分割成数组,再使用 array_unique() 函数去除数组中的重复值,然后将唯一的拼音数组合并成一个字符串,使用逗号作为分隔符,最后将唯一的拼音值存回原始数组中。
在火车头的Plugins文件夹下新建一个PHP文件,文件名随意,把以上代码写入到此php文件中,最后在采集器中的第四步,其他设置中的插件里选择刚才新建的插件文件即可。
已下是经过PHP插件处理后的结果。
以上教程放给有需要的小伙伴。
#免责声明#
ZHANN.CN帝国之家工作室内所有作品,均为ZHANN手写代码。部分样式或模板代码移植或仿造自互联网(如有侵权,出示著作权证书联系我删除),所有代码不能用于非法站点(色情,暴力,政治类站点)。ZHANN只提供源代码服务,不提供任何建站服务。不承担任何建站后的法律问题!ZHANN所得费用均为制作模板劳动报酬。使用开源免费的帝国CMS作为核心,请保留帝国CMS的版权。如商用请购买帝国商业版,ZHANN只做帝国CMS模板服务,不做任何建站、不制作采集任何网站内容、不出售任何非开源有版权源代码更不卖任何域名和空间服务器,我出卖的只是我的技术劳动力!如在本站发生交易任何资源或者下载任何资源,则代表默认同意以上文字内容。感谢小伙本的支持,做一个知法守法的好公民!