前嗅大数据—ForeSpider教你如何采集【列表数据】 -

qianxiu

浏览: 42555 次

最近访客更多访客>>

wangyy

leimingchao

masuweng

abc123

博主相关

博客

微博

相册

留言

关于我

文章分类

社区版块

存档分类

前嗅大数据—ForeSpider教你如何采集【列表数据】

博客分类：

以采集起点中文小说网中（https://www.qidian.com/）的数据列表的数据为例：

一.网站结构

1.网站截图说明

采集起点中文网中的最近更新数据列表中的数据，如下图所示：

【列表数据页面】

2.采集结果截图

【采集出来的列表数据】

二.配置模板

新建任务

点击下一步，由于仅需要采集本页面表格数据，所以勾选【抽选数据】。

2.创建/选择表单

表单创建后可以重复选择使用，如果已有建好的表单，选择对应数据表单即可。如果没有，点击创建表单。

【创建表单】

根据所需内容，配置表单字段，此处配置了id（主键）、fenlei（小说类别）、shuming（小说名称）、zuixin（最新章节）、zuozhe（作者）、shijian（更新时间）等字段。

注意：采集表格/列表数据时，id（主键）设置的时候，选择自增主键。=>（字段各属性介绍）

方式一：快速建表。（点击【创建表单】出现弹窗。）

【配置表单】

方式二：自由建表。（在【数据建表】界面。）

【配置表单】

4.识别列表

选中表单后，chrl+点击表头第一个表格，后shift+点击其他表头扩大选取，直至所有表头均被选中，最后点击识别列表。

【识别列表】

【列表识别成功】

5.字段取值

①fenlei：通过字段定位取值，按ctrl+单击标题，确认选取。

②shuming：通过字段定位取值，按ctrl+单击标题，确认选取。

③其他字段按照同样的方法进行字段取值。

6.关联数据表

先创建一个数据表，如下图所示

再关联表单，勾选数据表。

7.模板预览

点击采集预览，进行预览。

【采集预览】

三.数据采集

运行设置

运行设置处可以设置采集速度、采集策略、任务装载等。

【运行设置】

2.选择采集任务

在【任务列表】中勾选需要采集的任务，可勾选多个任务，同时采集。

【选择采集任务】

3.开始采集

点击【开始采集】，系统开始进行采集。剩余任务数为0时，系统自动停止采集。用户也可以自己暂停任务或停止任务（停止任务会释放任务，再次启动时重新装载任务）。

【开始采集】

4.数据浏览

采集一段时间以后，点击【数据浏览】，在数据列表中选中对应的数据表，即可浏览采集到的数据，点击【刷新】按钮可以同步显示数据。

【数据浏览】

5.导出数据

点击【导出】按钮，选择导出文件格式后保存。

【导出数据】

分享到：

前嗅ForeSpider采集教学：通过关键词采集【 ... | 2019十大科技事件盘点：“量子纠缠”见证真 ...

2020-01-09 14:47
浏览 484
评论(0)
分类:行业应用
查看更多

发表评论

您还没有登录,请您登录后再发表评论

最近访客更多访客>>

博主相关

文章分类

社区版块

存档分类

最新评论

前嗅大数据—ForeSpider教你如何采集【列表数据】

评论

发表评论

相关推荐

最近访客 更多访客>>

博主相关

文章分类

社区版块

存档分类

最新评论

前嗅大数据—ForeSpider教你如何采集【列表数据】

评论

发表评论

相关推荐

从零学爬虫：采集房天下二手房信息

建网站/APP最全准备攻略

前嗅教你大数据：常见几种编码介绍

前嗅教你大数据：常见的网站反爬策略与解决方案

如何在ForeSpider数据采集器中设置代理IP

前嗅教你大数据——史上最全代理IP服务商对比

钱嗅教你大数据——什么是代理IP？

看完之后，不要再说不懂代理IP了！

看完之后，不要再说不懂代理IP了！

了解爬虫，这一篇就够了！

前嗅ForeSpider数据采集教程：采集【中国证券网】的正文数据

前嗅ForeSpider采集教程：通过关键词的【检索列表】采集【检索结果】

前嗅forespider教程：关键词采集【检索结果】

ForeSpider采集教程：如何采集网页中附件数据

ForeSpider采集教程：如何采集图片及链接地址

ForeSpider采集教程发布（论坛类）：零基础轻松获取数据

ForeSpider采集教程发布（表格类）：零基础轻松获取数据

爬虫软件真的可以获取隐私数据？真相只有一个

前嗅，做你的专属技术合伙人

如何用大数据在5分钟内完成一份行业报告，以果酒行业为例

最近访客更多访客>>