易语言+火车头采集器,打造半自动采集内容并发布到wordpress站点的机器

其实一直以来,我都是用火车头采集器半自动更新几个网站内容。为什么说是半自动?我之前的操作手法是:从火车头将内容采集到本地,保存为html文件。然后手动发布,在wordpress编辑器发布文章时复制内容到里面,适当编辑一下内容,像修改一下标题,增删一些正文内容等。但最近,觉得这种做法有点儿麻烦,比较费精力。

所以,我花了两天时间来改善了一下内容。具体想要实现的功能是这样的:

一、火车头采集内容,将图片下载到本地来,文章保存到本地数据库
二、我手动用软件对下载的图片进行调整尺寸处理(宽度大于700px的进行缩小,小的不变),加水印处理(覆盖掉原来的水印)
三、然后将图片上传到阿里云图床,替换掉原来正文中图片链接。
四、火车头里直接对接wordpress,远程发布文章

说说我的解决过程:

火车头采集这点不用多说,很简单,无非是测试采集规则,对原网站图片进行一些代码替换。
易语言+火车头采集器,打造半自动采集内容并发布到wordpress站点的机器_图片 No.1
图片进行处理,用到的软件是【图像批量调整大小工具(Fotosizer)】,非常好用的一款软件,可以针对不同的网站设置不同的水印配置,直接调用即可。

易语言+火车头采集器,打造半自动采集内容并发布到wordpress站点的机器_图片 No.2

关于图片的存放位置,我最初做法是上传到wordpress的uploads目录,也就是和编辑文章时上传的图片路径一样,后面发现网站打开奇慢。我是香港轻量应用服务器,24元一月的那种。没想到本地存几张图片网页访问就经常卡爆。放弃,第二种想法就是上传到阿里云oss图床,然而这一步之前文章提到的原因就是生成不了缩略图也放弃了(详情参考这篇文章:阿里云oss作为图床外链,wordpress缩略图不显示,提示:An error occured fetching image.)然后来到第三种文案,我用易语言写一款小软件,将正文源码复制到软件里,自动分析里面的图片,然后上传到阿里云免费图床,将返回的外链图片链接,替换掉本地图片路径。然后保存到火车头里。
易语言+火车头采集器,打造半自动采集内容并发布到wordpress站点的机器_图片 No.3

易语言+火车头采集器,打造半自动采集内容并发布到wordpress站点的机器_图片 No.4
这个上传图片的功能还是很难的。光是post这一块,我最初目标是微博图床,然而技术有限,实现不了。后面又是京东图床,代码倒是写好了,jpg能实现,但是png与gif又实现不了,而且它间歇性抽风,不能保证上传就一定成功,放弃。最后阿里云图床,测试了好几个接口,终于实现成功。

火车头发布文章到wordpress,是找到了大神写的现在的模块【Wordpress免登陆发布接口】,最新版本wordpress5.2版本也能很好地支持。

易语言+火车头采集器,打造半自动采集内容并发布到wordpress站点的机器_图片 No.5

其实我最初的想法是:
使用python来下载图片,进行图片水印调整、水印添加,然后再上传到图床。这对于我来说,实在是太难了。毕竟我从来没有使用过python写出一款软件。虽然爬虫方面的知识有点相通的感觉。但实际操作起来相当有难度。
最后回头一想,我易语言还马马虎虎。写起来比较顺手。然后搭配手动,效率也还行。
于是,这个项目就这样出来了。

声明:本文为原创,作者为 代码小白,转载时请保留本声明及附带文章链接:https://www.zixuekong.com/447.html