同花顺股票数据采集
2018-01-11 18:40:41 阅读量: 23394
本文介绍使用八爪鱼采集 同花顺行情中心股票数据 的方法。
采集网站:
http://q.10jqka.com.cn/#refCountId=db_509381c1_860
采集内容包括:
股票代码、股票名称、现价、涨跌幅(%)、涨跌、涨速(%)、换手(%)、量比、振幅(%)、成交额、流通股 、流通市值、市盈率。
使用功能点:
lAJAX点击和翻页
/tutorialdetail-1/ajaxdjfy_7.html
步骤1:创建同花顺股票数据采集任务
1)进入八爪鱼客户端主界面,选择“自定义采集”,点击“立即使用”
2)将要采集的网站URL复制粘贴到输入框中,点击“保存网址”
步骤2:创建翻页循环
1)系统会自动打开网页。下拉页面至底部,点击“下一页”按钮。在右侧的操作提示框中,选择“循环点击下一页”,以创建一个翻页循环
备注:页面右上角有一个“流程”按钮,可根据需要,打开或者关闭。打开后,会如上图显示;关闭后,仅显示页面下方的浏览器部分
2)由于此网页涉及Ajax技术,我们需要进行一些高级选项的设置。选中“点击元素”步骤,打开“高级选项”,勾选“Ajax加载数据”,设置时间为“5秒”(时间需根据网页情况进行设置,设置的时间>网页加载时间即可)
备注:AJAX即延时加载、异步更新的一种脚本技术,通过在后台与服务器进行少量数据交换,可以在不重新加载整个网页的情况下,对网页的某部分进行更新。
表现特征:a、点击网页中某个选项时,大部分网站的网址不会改变;b、网页不是完全加载,只是局部进行了数据加载,有所变化。
验证方式:点击操作后,在浏览器中,网址输入栏不会出现加载中的状态或者转圈状态。
具体请查看AJAX点击和翻页教程:
/tutorialdetail-1/ajaxdjfy_7.html
步骤3:创建列表循环并提取数据
重要提示:示例网页刷新速度较快。创建列表循环整个步骤,需在下一次页面刷新之前完成。否则,页面刷新会中断循环列表的建立。
1)移动鼠标,选中页面里第一个单元格。在操作提示框中,点击右下角的扩大选区按钮
2)可以看到,页面中第一行作为整个元素被选中,第一行中的每个数据作为子元素被系统识别。在操作提示框中,选择“选中子元素”
3)系统继续自动识别出页面中的其他20组同类元素。在操作提示框中,选择“选中全部”,以建立一个列表循环
4)可以看到,页面中所有子元素均被选中,变为绿色。右侧操作提示框中,出现字段预览表,选择“采集数据”
5)如图位置,选中相应的字段,可以进行字段的自定义命名。完成后,修改完成后,点击“确定”
6)点击“开始采集”,选择“启动本地采集”
备注:本地采集占用当前电脑资源进行采集。如果存在采集时间要求或当前电脑无法长时间进行采集可以使用云采集功能,云采集在网络中进行采集,无需当前电脑支持,电脑可以关机,可以设置多个云节点分摊任务,10个节点相当于10台电脑分配任务帮你采集,速度降低为原来的十分之一,采集到的数据可以在云上保存三个月,可以随时进行导出操作。
步骤4:数据采集及导出
1)采集完成后,会跳出提示,选择“导出数据”,选择“合适的导出方式”,将采集好的数据导出
2)这里我们选择excel作为导出为格式,数据导出后如下图