如何用简数采集平台采集二手车网站
的有关信息介绍如下:本文介绍如何用‘简数数据采集平台’采集二手车网站。
数据采集平台是一个完全在线配置和云端采集的网页数据采集和发布平台,功能强大,操作简单,不仅提供网页内容采集、数据加工处理、SEO工具和发布等数据采集基本功能,还创新实现了智能提取引擎、书签一键采集发布等特色功能。另外还支持微信公众号文章、淘宝联盟商品的一键快速采集。
搜索想要采集的二手车网站,进入买车列表页;
打开简数数据采集平台网页,登录进入控制台(没账号自己注册),点击创建采集任务,输入相关信息;
下一步,点击列表提取器进入列表页选择采集的链接;
这里是可视化操作,不懂代码也可以操作;
先点击‘重置当前字段配置’,再去点击车链接,选择两个时系统会自动识别类似链接,完成后记得点击保存;
PS:绿色框的代表该处为已选择内容;
下一步,同理进入详情页提取器,查看各字段内容是否需要修改;
这里也是可视化操作,分别修改title和content字段等对应的内容,选择的内容会以绿色框表示,完成后记得点击保存,详情看图片;
完成全部设置后,点击启动运行,等待采集完成;
PS:
1. 该例子首次出现的不是车辆详情页,通过点击“典型详情页网址”栏出现下拉链接列表,从中选择正确的详情页来配置;
2. title,content等字段可以勾选上“采集结果不得为空”,来过滤掉非详情页的采集;
3. 该例子修改了tag字段,修改为price字段,添加pic字段;
创建发布目标(以发布到织梦DEDE为例)
在采集任务管理页面,找到“发布目标管理”==》点击按钮“+织梦DEDE”;
在“设置对应字段”页面设置必填和需要对应的字段,注意系统优先使用“值来源1”;
PS:各CMS系统要先安装对应的简数插件,下载织梦发布插件可在简数采集官网==》帮助中心==》数据与发布导出==》发布到织梦DEDE ;
切换至“结果数据&发布“栏,在数据列表选中一条或多条数据,点击上面的“数据发布”按钮,选择刚刚配置的发布目标织梦DEDE,待发布完成;
到这采集就完成,十分简单,方便,快捷;
PS:这里以发布到织梦测试站为例;
简数数据采集网有配置好的模板,欢迎大家食用;