`
文章列表
从今天起,小编开始教大家逐步进行可视化配置操作。首先,我们来学习第一步:创建新任务,主要包括创建新任务的操作步骤,操作中的注意事项两部分内容。       一,创建新任务操作步骤:       1.添加新任务 点击任务列表右侧,新建任务文件。     【添加任务】   此时会出现一个弹框,可以在弹框中填写采集地址,修改任务名称,以及选择是否需要登录/关键词采集。     【新建任务】       2.填写采集地址 在弹窗里填写采集地址和任务名称。 【填写采集地址】   采集地址一般选择目标网站的入口地址,比如首页。   大多数情 ...
今天,小编为大家介绍一下,前嗅ForeSpider中数据浏览界面,具体内容如下:   在“数据采集”页面开始采集后,可以在“数据浏览”页面点对应的数据表,点击“刷新”按钮,即可实时查看采集到的数据。     【数据浏览界面】   1.数据列表   展示已经建立的数据表。选择需要浏览的数据表,查看具体数据。     【数据列表】   2.数据浏览   在数据浏览页面可以浏览数据库中的数据。     【数据浏览列表】     3.按条件检索   在数据浏览中,可按条件检索具体数据记录。有按字段检索、整体检索两种方式。     【 ...
今天,小编为介绍一下,前嗅ForeSpider中数据采集界面里:运行设置,IP代理设置,验证码设置,这三大设置的界面,具体内容如下:       一,运行设置       数据采集前的运行设置,包括采集速度、采集策略、任务装载、网络超时、HTTP设置、加载设置、任务模式、任务定时、预警设置、过滤设置10个部分。     【运行设置界面】   二,IP代理设置 软件支持动态和静态IP代理,http/https/socket代理。当需要启用IP代理时,需要在资源管理界面添加代理资源。 【IP代理设置界面】   1.启用IP代理   启用IP代理采集时 ...
从今天开始,前嗅的小伙伴们就开始上班了,在此小编代替前嗅所有员工,给大家拜个晚年,祝大家在新的一年工作顺利,万事如意!   同时也为大家带来了新的教程:前嗅ForeSpider数据采集中采集列表的界面介绍,大家在操作中有什么疑问的快快发过来吧~   【数据采集界面】   1.装载记录   可以实现日志的统计功能。 【装载记录-统计】       2.采集列表/装载记录       (1)采集列表   进行数据采集时,可在采集列表查看任务的采集状态。     【采集列表】 开始采集数据 先自动清空历史装载记录 并重新开始采集 ...
今天,小编为大家介绍一下,前嗅ForeSpider的数据建表,和高级配置界面,具体内容如下:   一,数据建表 ​ 【数据建表界面】 1.采集表单 数据采集之后需要存入数据库,在ForeSpider中创建的表单,就是数据采集入库的表结构。不同的频道可以使用同一个表单,创建任意多个数据表。 ​ 【采集表单】   2.表单配置 用于配置字段属性、采集内容、数据类型、数据长度、高级类型和字段说明。(方法一:快速建表/方法二:自由建表 【表单配置】 ​ 添加字段。 ​ 编辑字段。
今天,小编为大家介绍一下,前嗅ForeSpider的采集配置界面,具体内容如下:   启动ForeSpider采集软件后,默认界面如图所示。ROOT任务下有已经配置好的示例模板,点击网站图标即可进行采集预览。可在任务列表选择某一任务按照需求重新配置。 【采集配置界面】   1.任务列表 ​ 【任务列表】 任务对应着采集来源,通常一个采集来源对应着一个任务。如采集人民网时,人民网就是一个任务;通过百度采集全网信息时,百度就是一个任务;通过100个网址导航采集全球域名时,这100个网址导航就是一个任务。   2.任务属性配置 用户可根据采集需求与网站的设置选择性的配置任务 ...
天小编为大家带来的教程是,采集58同城数据,同样适用于其他类似网站,具体操作如下:   第一步:新建任务 ①点击左上角“加号”新建任务,如图1: ​ ②在弹窗里填写采集地址,任务名称,如图2: ​ ③点击下一步,选择进行数据抽取还是链接抽取,首先采集58同城·便当分类下的分类列表的链接,所以点击抽取链接,如图3:
今天,小编为大家演示一下,如何采集美团网数据,具体操作如下:   第一步:新建任务 ①点击左上角“加号”新建任务,如图1: ​ ②在弹窗里填写采集地址,任务名称,如图2: ​ ③点击下一步,选择进行数据抽取还是链接抽取,首先当前检索结果列表链接,所以点击抽取链接,选择链接抽取,如图3:
今天小编为大家带来的教程是:采集黄页88,同时也适用于采集其他的企业信息网站,具体操作流程如下:   第一步:新建任务 ①点击左上角“加号”新建任务,如图1: ②在弹窗里填写采集地址,任务名称,如图2: ③点击下一步,选择进行数据抽取还是链接抽取,本次采集当前列表页联系方式链接,正文数据是通过点击列表链接进入的,所以本次需要抽取列表链接,所以点击抽取链接,翻页选择普通翻页,如图3: ④完成后模板抽取配置列表有两个模板,默认模板和链接列表。默认模板下自动生成两个链接抽取,一个为链接列表抽取,已与模板“链接列表”关联,一个为普通翻页链接,此链接已与默认模板自身关联,如图4 ...
    前几天有人问如何采集中国证券网,小编整理了一下,在此为大家做一下演示,同样适用于其他金融经济型的网站:   第一步:新建任务 ①点击左上角“加号”新建任务,如图1: ​   ②在弹窗里填写采集地址,任务 ...
上周小编介绍了如何采集360问答,今天小编再来为大家演示一下,如何采集CSDN论坛,同样适用于所有的自媒体论坛。   第一步:新建任务 ①点击左上角“加号”新建任务,如图1:   ②在弹窗里填写采集地址,任务名称,如图2: ③点击下一步,选择进行数据抽取还是链接抽取,本次采集当前列表页博文的正文数据,正文数据是通过点击列表链接进入的,所以本次需要抽取列表链接,所以点击抽取链接,如图3:
    今天,小编来教大家如何采集论坛自媒体类网站的数据,以采集360问答为例,为大家进行演示操作,该操作同样适用于其他类似网站:   第一步:新建任务 ①点击左上角“加号”新建任务,如图1:   ②弹窗里填写采集地址,任务名称,开启手动登录配置,如图2: ​ 若未在此处开启登录配置,可在模板抽取配置中点击相应的模板,开启登录配置,如图3。
   最近后台有很多童鞋问怎么采集新闻,今天小编以采集新浪新闻为例,来为大家进行演示,同样适用于其他新闻网站的采集,具体操作如下:   第一步:新建任务 ①点击左上角“加号”新建任务,如图1: ​   ②在弹窗里填写采集地址,任务名称,如图2:   ③点击下一步,选择进行数据抽取还是链接抽取,本次采集当前列表页新闻的正文数据,正文数据是通过点击列表链接进入的,所以本次需要抽取列表链接,所以点击抽取链接,如图3: ​   第二步:通过定位过滤、地址过滤,得到所需链接 ①按住Ctrl+鼠标左键,进行区域选择,按住Shift+鼠标左键,扩大选择区域,点击“确认选区”按钮,如 ...
   昨天为大家介绍了如何采集图片/视频/资源文件后,有小伙伴问我如何采集他们的链接地址,今天小编就为大家演示如何采集图片/视频/资源文件的链接地址,操作如下:   第一步:新建任务 ①点击左上角“加号”新建任务,如图1:   ②在弹窗里填写采集地址,任务名称如图2: ​ ③点击下一步,选择进行数据抽取还是链接抽取,本次采集所有页面的图片,图片链接是通过点击图片列表链接进入的,所以本次需要抽取列表图片链接,所以点击抽取链接,如图3: ​   第二步:选择链接类型 由于本次需要取到的是图片链接,图片链接不同于其他网页链接,所以需要特殊对待,在链接(网址)属性配置下面的 ...
第一步:新建任务 ①点击左上角“加号”新建任务,如图1: 【图1】 ② 弹窗里填写采集地址,任务名称如图2:  【图2】 ③点击下一步,选择进行数据抽取还是链接抽取,本次采集所有页面的图片,图片链接是通过点击图片列表链接进入的,所以本次需要抽取列表图片链接,所以点击抽取链接,如图3:
Global site tag (gtag.js) - Google Analytics