- A+
提到互联网内容采集,估计大家都会首推火车采集器,的确说到火车采集器——这款专业的互联网数据抓取、处理、分析,挖掘软件,可以非常灵活迅速地抓取网页上散乱分布的数据信息,并通过一系列的分析处理,准确挖掘出所需数据。历经十二年的升级更新,积累了大量用户和良好口碑,是目前国内最受欢迎的网页数据采集软件。
3z学堂也在使用这个软件,软件的功能和用法今天就不给大家介绍了,如果大家感兴趣,回头3z学堂可以专门给大家整理些教程,今天主要分享一个3z学堂在使用过程中遇到一个小经验,就是通过火车采集好内容发布到WordPress后,发现文章标签结果全部显示是 [db:tag],这个效果还是不能接受的,对SEO也很不利,那么需要怎么处理就可以不显示这个呢?
经过一番摸索,终于找到原因,因为3z学堂使用的火车采集自动发布模块是从淘宝上直接买来的现成的,原因就是采集规则里面,没有建立 发布时间 这个标签,但是发布模块里却包含有这个标签所致。正常的文章采集会包含标题、作者、发布时间等,如下图。
找到问题就好办了,解决办法就是修改采集规则标签和发布模块标签,把名字一一对应,这样就没有问题了,如下图就是在采集规则里添加时间tag来对应发布规则。
如果是需要修改发布规则的话,就需要修改文件,首先进入火车采集安装目录,备份一份 wordpress.wpm,在火车头的根目录下打开“WebPostModule.exe” 加载模块,选择wordpress.wpm选择顶部菜单 “内容发布参数”----点击“tag表单”----删除表单项-- 保存推出模块后即可。不过这种做法是删掉了文章标签,这点大家要注意。
今天的火车采集应用技巧,3z学堂就给大家分享到这里,欢迎大家在使用中遇到什么问题及时分享、交流,共同进步!
2018年12月7日 下午2:28 沙发
不错不错,web开发的58版,啥都有
2018年12月7日 下午2:56 1层
@哈哈 感谢支持!希望有帮助到你~
2018年12月7日 下午2:48 板凳
赞,楼主更新文章很拼
2018年12月7日 下午2:55 1层
@乱翻书 感谢关注~欢迎常来交流!
2018年12月7日 下午3:45 地板
学习了,必须打赏
2019年5月13日 上午12:58 4楼
文章不错支持一下吧,非常喜欢
2019年5月14日 上午9:04 1层
@热搜头条 感谢支持,希望有帮助到你~