火车头采集器采集文章网址[精编图文版]
的有关信息介绍如下:之前为大家分享了一篇《火车头采集器安装流程[精编图文版]》,下面解决一下火车头采集器采集文章网址的方法。
寻找目标网站:
我们以辽宁高考网(高考作文栏目)为目标站:,大家学会方法后可以采集任何网站。
创建采集站点及任务:
1、打开“火车头采集器”,这里我们以2012sp3版本演示(其它版本操作方法类似);
2、创建采集站点(如果只采集一个网站,可以随便写,如果需要采集很多网站,就需要进行编号,以免采集重复);
3、右键已经创建的采集站点,新建“采集任务”;
采集文章网址(很关键):
1、如图操作:
填写任务名->向导添加->单条网址->粘贴目标采集网址->添加->完成;
2、右键目标采集页->查看源文件;
3、找到文章网址列表开始和结束标签(如图);
4、在火车头采集器[页面内选择定区域采集网址]填写,开始和结束标签;
开始测试采集网址:
文章网址已经采集成功,如果采集网址中不是文章网址,有可能是开始和结束标签有问题,请大家在仔细查找。