火车头采集器初学者入门教程要点解析.pptx

火车头采集器初学者入门教程要点解析.pptx

  1. 1、本文档共45页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
火车头采集器     使用流程说明;目录;火车头采集器官网地址为: 最新版本为8.4,可以从官网下载到,下载地址: /v8/LocoySpider_V8.4_Builrar 如不会安装apache、mysql可以使用一键安装软件—XAMPP: /xampp/xampp_1.8.3_5.exe 以下是本文中提到的其他一些软件的下载地址: phpmyadmin /phpMyAdmin/phpMyAdmin_4.2.11.zip navicat for mysql版 /soft/38153.html 软件需要破解 注册码:NAVH-WK6A-DMVK-DKW3 名称和组织不用填写 ;火车头采集器有付费版和免费版,免费版基本能满足需求。下面内容是以免费版功能进行的讲解。 打开火车头软件出现如何界面,由于使用的是免费版本,不用修改,点击登录即可。;打开火车头软件,界面如下图:;第一步:根据需要建立分组或任务,任务需要建立在分组之下(如下图);二、新建站点;点击起始网址区域右侧“添加”按钮后,根据需求选择添加采集网址模式,这里我们先选择“批量/多页”为例:;三、采集网址;三、采集网址--批量/多页;三、采集网址—单挑网址;三、采集网址—文本导入;三、采集网址—文本导入;三、采集网址; 三、采集网址--多级网址获取; 三、采集网址--多级网址获取; 三、采集网址--多级网址获取; 三、采集网址--多级网址获取; 三、采集网址--手动填写链接地址规则; 三、采集网址--测试网址采集; 三、采集网址—网址过滤; 三、采集内容; 三、采集内容; 三、采集内容—分页获取; 三、采集内容—分析需要采集字段; 三、采集内容—标签修改; 三、采集内容—内容替换; 三、采集内容—文件下载选项配置; 三、采集内容—HTML标签过滤; 三、采集内容—正则提取; 三、采集内容—正则提取; 四、内容发布—存成文件格式; 四、内容发布—导入到自定义数据库; 四、内容发布—导入到自定义数据库; 四、内容发布—导入到自定义数据库; 四、内容发布—导入到自定义数据库; 四、内容发布—导入到自定义数据库; 四、内容发布—导入到自定义数据库; 四、内容发布—导入到自定义??据库; 四、内容发布—导入到自定义数据库; 四、内容发布—导入到自定义数据库; 五、其他功能—重新采集其他数据;五、其他功能—导出任务;五、其他功能—导入任务;END THANKS!

文档评论(0)

妈妈王子 + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档