您的位置首页百科知识

火车头采集器采集文章网址[精编图文版]

火车头采集器采集文章网址[精编图文版]

的有关信息介绍如下:

火车头采集器采集文章网址[精编图文版]

  之前为大家分享了一篇《火车头采集器安装流程[精编图文版]》,下面解决一下火车头采集器采集文章网址的方法。

寻找目标网站:

我们以辽宁高考网(高考作文栏目)为目标站:,大家学会方法后可以采集任何网站。

创建采集站点及任务:

1、打开“火车头采集器”,这里我们以2012sp3版本演示(其它版本操作方法类似);

2、创建采集站点(如果只采集一个网站,可以随便写,如果需要采集很多网站,就需要进行编号,以免采集重复);

3、右键已经创建的采集站点,新建“采集任务”;

采集文章网址(很关键):

1、如图操作:

填写任务名->向导添加->单条网址->粘贴目标采集网址->添加->完成;

2、右键目标采集页->查看源文件;

3、找到文章网址列表开始和结束标签(如图);

4、在火车头采集器[页面内选择定区域采集网址]填写,开始和结束标签;

开始测试采集网址:

文章网址已经采集成功,如果采集网址中不是文章网址,有可能是开始和结束标签有问题,请大家在仔细查找。