帝国cms火车头采集器发布接口用PHP批量替换采集到的正文内容
我采集了几百万篇文章,文章正文内的图片地址格式为http://zhann.a.com/d/file/20230101/1.jpg,此时我发布到网站,想批量把图片地址改成http://zhann.a.com/d/file/1.jpg
去掉中间的20230101日期目录,应该怎么操作呢?
方法:
在火车头采集器免登陆发布接口中可以使用正则表达式来匹配不固定的日期,并将其替换为空字符串,代码如下:
$_POST['newstext'] = preg_replace('/\/file\/\d{8}\//', '/file/', $_POST['newstext']);
这里使用了正则表达式/\/file\/\d{8}\//
来匹配类似于/file/20230101/
这样的字符串,其中\d{8}
表示匹配8位数字。然后使用preg_replace()
函数将匹配到的字符串替换为/file/
。注意,正则表达式中的斜杠需要进行转义。
如果你不熟悉正则表达式,可以参考一些在线的正则表达式教程和工具,例如 RegexOne 和 RegExr。
参考接口:https://www.nabaike.com
#免责声明#
ZHANN.CN帝国之家工作室内所有作品,均为ZHANN手写代码。部分样式或模板代码移植或仿造自互联网(如有侵权,出示著作权证书联系我删除),所有代码不能用于非法站点(色情,暴力,政治类站点)。ZHANN只提供源代码服务,不提供任何建站服务。不承担任何建站后的法律问题!ZHANN所得费用均为制作模板劳动报酬。使用开源免费的帝国CMS作为核心,请保留帝国CMS的版权。如商用请购买帝国商业版,ZHANN只做帝国CMS模板服务,不做任何建站、不制作采集任何网站内容、不出售任何非开源有版权源代码更不卖任何域名和空间服务器,我出卖的只是我的技术劳动力!如在本站发生交易任何资源或者下载任何资源,则代表默认同意以上文字内容。感谢小伙本的支持,做一个知法守法的好公民!