方法一:通过点击“下一步”后勾选抽取数据再次点击“下一步”得到数据抽取,如图8
方法二:直接点击模板二点击上面“新建数据抽取”按钮,得到数据抽取如圖8
第六步:创建/选择表单
在ForeSpider爬虫中,表单是可以复用的所以可以在数据表单出直接选择之前建过的表单,也可以通过表单ID来进行查找并關联数据表单此处使用的是之前建过的凤凰网的表单,创建表单如图9
方法一:通过下拉菜单或表单ID选择已有表单
方法二:点击创建表單进入快速建表页面,新建表单
方法三:点击“采集配置”-“数据建表”点击采“采集表单”后面的如图10
根据所需内容,配置表单字段(即表头)此处配置了包括标题、作者、发布时间、文本内容以及网址五个字段,表单如图11
取值方法:按住Ctrl+鼠标左键进行区域选择,按住Shift+鼠标左键扩大选择区域。
① 标右键点击“数据抽取”然后点击“模板预览”,如图13
① 击右上角采集预览,如图15
②双击任意一条链接看看是否可以得到和网页对应的规整的数据,如图16