zblog火车头采集规则 zblog火车头发布模块

新手使用火车头发布接口如何采集文章教程

前沿:

让客户满意是我们工作的目标,不断超越客户的期望值来自于我们对这个行业的热爱。我们立志把好的技术通过有效、简单的方式提供给客户,将通过不懈努力成为客户在信息化领域值得信任、有价值的长期合作伙伴,公司提供的服务项目有:域名申请网站空间、营销软件、网站建设、利津网站维护、网站推广。

如果你对火车头一点都不知道,你还是去网上自学一点火车头采集的知识,我也不是什么大师,硬着头皮写的,至少能用,在这里我不会教你如何写采集规则,因为写法种类太多,你问我我也不知道,火车头相关文件夹里提供的发布接口内置了马甲发布文章,并且支持远程图片抓取本地化,和发布文章时间设置(10-70分钟随机)。用户只需关注火车头标题和内容即可,参数值标题(title),内容(content)。

第一步:站点设置里设置下火车头免登录发布接口的全局变量值:

第二步:将发布接口上传覆盖程序根目录:

第三步:登录火车头软件后导入发布模块"

下图更多处下拉--选择导入:

导入后:

上图中,数字1处填写你在网站后台设置的全局变量值。

2 处选择 utf-8 编码。

3 处填写你网站域名,不要带 反斜杠'/'.

4处选择不需要登录

5 处点击获取列表--选择你需要入库的分类

6 随便给当前这个发布模块写个名字,后续采集任务模块会用到。

最后点击保存配置按钮。

---------

下面讲解导入采集任务:

新建任务分组后,在该分组下导入任务规则(导入任务至该分组):

选择我们的采集任务规则(.ljobx文件):

下一步:双击规则项

点击第三步:修改发布内容设置

修改下你发布的分类:

最后保存即可:

然后右键开始任务采集:

火车头如何采集还有缩略图的文章呢

1、首先在采集列表页的源码中将带有缩略图的那部分源码复制下来,如图:

2、查看网站的源码,找到这行代码,如图:

3、打开火车头,进入采集网址规则—添加多级网址采集规则,选中手动填写链接地址规则,并将第二步骤中选中的代码粘贴进去,如图:

4、将代码进行如下修改:

5、改好后保存并进行采集测试,如图所示

6、然后再在采集内容规则里进行修改,选中“缩略图”标签,打开,进行内容替换,如图:

7、然后点击文件下载,选中下载图片,并填好缩略图保存路径及命名方式,如图:

8、在“文件保存及部分高级设置”里设定缩略图的保存盘符及其前缀,我设定为桌面,前缀为“./”,如图:

9、我们保存后测试一下,一起顺利,缩略图顺利采集下来了

如何写火车头采集器的采集规则,采集页面上图片内的文字?

不得不说火车头是有一定用处,但是个人觉得不怎么好用,光是写那些采集规则,设定什么的就一大堆不明不白的东西。拿钱购买嘛,一开始那客服还很热情的为你解答,一交完钱买下来了,写规则,好了,有问题要找客服解决,结果一拖再拖,弄了一个多月还没弄好,整个网站的工作进程全拖慢了,还不如自己辛苦点自己手动写文章,还采集啥啊~

言归正传,火车头使用:新建站点—新建任务—填写你要采集的网站文章列表—点下面的开始测试网址—如果有采集到很多文章,看各个地址相同部分(如system/2012/03/07),点返回修改,把system/2012/03/07这部分加到“文章内容必须包含”那里,再测试一下,就可以采集到3月7日的文章地址了—前面准备好网址后接下来就是第二步的采集内容规则了,点第二步,设定标签,一般采集包括标题title/title、关键字meta name=keyword...、内容div.../div,这些设置从你要采集的网站代码上可以找到相应的——采集页面上的图片,在第四步,“文件保存及高级设置”,选择所有文件本地保存文件夹(这里是从页面下载图片存放的位置),然后下面有个FTP同步文件上传的,填好服务器、用户名、密码什么的,文件上传根目录就是你网站服务器放置图片的文件夹位置,你可以在服务器新建一个文件夹试试看,OK!到此为止,不过有一些网站写了反采集代码,有可能会被封IP,整体来说,个人不提倡使用火车头采集器,还不如个人手动来得实在,就算一天少发点也行,只要保证每天更新量、伪原创和原创,一样有很大效果。


本文名称:zblog火车头采集规则 zblog火车头发布模块
当前地址:http://azwzsj.com/article/dohihdj.html