华尔街: 如何利用“另类数据”预测股价?
你一定很好奇,什么是“另类数据”?它真的可以预测股价吗?
进入主题前,先分享一个真实案例:
“用手机信号预测特斯拉股价”
▼▼▼
特斯拉的量产能力一直饱受华尔街分析师们诟病,后者对其负面评价导致特斯拉的股市表现一直持续向下。
通过跟踪特斯拉的量产能力和股价表现,我们发现其量产能力和它的股价之间的强相关关系。
“一旦特斯拉量产能力超出预期,股价上涨,反之则下跌。”
找到“量产能力”这个影响股价涨跌的关键变量后,作为投资者,我们如果能提前知道特斯拉下一季的量产能力,是否就能提前预测它的股价走势,并从中赚取差价?
答案:可以。
近日在邵恒头条上看到一则介绍:
美国有一家Thasos的数据公司,监控了Tesla在加州弗里蒙特的工厂里员工手机的信号。他们想用这个信息来预测特斯拉的量产情况。
Thasos预测,Tesla员工的加班时长和其量产能力成正比,加班越长,量产越高。通过监测员工手机信号,可以知道员工的加班情况。
在2018第三季度,他们发现Tesla员工工作时长大幅增加,在整个季度通宵轮班的比例增加了30%。因此他们判断,Q3的量产应该会有大幅增长。
结果等Tesla第三季度财报出来显示,Model 3车型的产量翻了一倍,当日股价应声上涨9%。
由此可见,特斯拉工厂员工的手机信号数据能让投资机构在公司发布财报前,提前掌握Tesla下一季度的生产情况。
有了这个“信息差优势”,机构就能从中谋取利。
在这个案例中,「手机信号」这样的数据,就被华尔街视作一种新的数据来源——“另类数据”。
华尔街新一轮“信息战争”
1.什么是另类数据?
另类数据又称Alternative Data,它也可以称为“非传统数据”、“新型数据”。
2.另类数据如如何分类?
图片来源:摩根大通量化研究部
1)个人活动产生的数据
社交媒体上的用户舆情和导向、各大网络的新闻评论、网络搜索量和流量。
2)商业活动产生的数据
金融或电商平台上的交易数据、企业相关的运营数据、政府收集的经济民生数据。
3)监测工具采集的数据
卫星实时拍摄的地面影像、基于LBS、GPS的上传定位数据、以及其他如物品传感器捕获的的海量数据,等等。
3.金融界新的“信息战争”
金融行业是一个充分依赖大数据辅助决策的行业,其本质上是一场由数据驱动的“信息战争”。
过去,金融机构获取数据方式大多来自于企业发布的财报、第三方审计报告、调研机构白皮书等。
而另类数据是通过网络爬虫、数据API接口、传感器获取的原始数据,能帮助投资机构,抢在公司财报发布之前,获得一手数据信息,提前布局机会或规避风险。
传统数据和另类数据的区别
制图:谢小雨
传统数据的劣势在于滞后性、是对企业历史经营的总结、容易受主观影响、存在片面性。
另类数据的特点在于快速、实时更新、较为客观全面。
“另类数据”诞生背景
1.全球数字经济爆发
1)互联网爆发增长
随着全球互联网近20年飞速发展,围绕人类和商业的行为几乎都已“触网”。我们目前积累了人类史上最丰厚的数字资产,衍生出“大数据技术”,挖掘其中隐藏的价值。
2)物联网逐渐形成
智能装备、卫星通信、传感器、芯片等技术出现,将原本不被感知的物理世界成为可数据化的分析对象。随着5G、云计算的不断成熟,未来将加速物理世界的数字化速度,使得物理数据成为全新的数据资产。
2.AI+金融衍生出量化金融变革
随着人工智能、大数据、云计算对传统金融业的变革,金融行业正与信息技术、数学模型、数据分析相结合,衍生出量化金融发展。
(量化金融涉及基础数据抓取及处理、量化交易策略编写及回测、实盘程序化交易、衍生品定价、机器学习、高频交易等模块的内容。)
量化金融依赖于丰富的数据对算法模型的训练,而另类数据能在深度学习和量化投资中提供充分“数据养分”。
据了解,美国的大型金融机构,每年花在另类数据购买的支出上就高达4亿美金,而且这个数字到2020年预计还会翻4倍。
金融机构如何处理“另类数据”?
类数据处理流程(参考)
制图:谢小雨
第①步:首先需要明确要采集的目标数据及其格式,这里最便捷的方法是使用目前市场上已经通用的数据爬虫工具(如八爪鱼数据采集器)将想要的数据以特定格式抓取下来。
第②步:然后数据工程师通过保存到各自的大数据存储平台对数据进行预处理,如清洗、筛选等,将无用或错误的干扰信息排除。
第③步:接着数据分析师或量化研究员运用机器学习,搭建算法模型,对数据源进行深层分析、挖掘。
第④步:提炼出可供趋势判断、决策的价值信号给投资经理、交易员或风控人员,做最终的决策。
▼▼▼
下面小八将再举几个例子告诉你,这些我们眼中的“另类数据”是如何改变华尔街投资机构的决策方式的。
“另类数据”金融应用案例
1.量化研究公司基本面
天灏资本(T.H. Capital)
曾在华尔街金融圈工作、现在研究公司总裁的灏资本创始人侯晓天分享,她们公司建立了一套对个股及行业进行另类数据爬取、清洗、处理及建模的研究系统,从网络海量无序的数据中寻找投资机会。
她将这套方法用于研究公司的基本面,通过爬取的数据、分析、算法客观、全面、实时地认识一家公司。
她认为对比过去,另类数据具备更全面、客观、准确,以及获取信息速度更快的优势。
2.卫星图象数据1)预测铁矿供应与价格
卫星实时监控矿场运行
2018年11月在澳大利亚一辆装载了268车铁矿的火车脱轨了。在此之后,铁矿价格出现了上涨,许多投资人认为这起事件会导致铁矿的攻击短缺。
但实际上,如果你找来了当时事故发生地的卫星图像,仔细分析后会发现在事故地点把铁矿重新装车并不难。掌握这个消息的投资人认为铁矿短期内价格可能会上涨,但过后肯定会让铁矿价格一定会回落。
基于这个信息,这些交易员赚了一大笔。
2)预测全球油的存储量
卫星监控的油盖阴影
美国加州的卫星数据分析公司Orbital Insight,通过油盖在阳光下的阴影模式,分析原油储量的变化趋势。
3)预测零售商店经营情况
卫星拍摄超市停车上的停车数量
早年沃尔玛创始人Sam Walton就通过数超市停车场的停车数量,判断该超市的经营情况。
如今我们可以通过卫星图像监测商场、餐厅附近的停车情况,以此预测该商场、餐厅的营业业绩。
加州大学伯克利分校的2个商学院教授对美国44个大型零售品牌,66000家门店的卫星图象数据进行了一个系统性的研究。
结果发现,根据这些门店停车场车辆数量的波动进行交易,收益率能比基本回报率高出接近5%。
但是,小八认为这个方法在美国适用,在中国却不一定。中国商场周边的车辆大部分都停在地下停车场,卫星图象监测不到。
3.社交内容数据
1)判断创业公司是否存在数据掺假
一支由几个人组成的技术团队,利用爬虫技术发现马蜂窝平台上有部分用户评论数据造假和掺水的现象,引发了互联网界的关注。恰逢马蜂窝当时正在进行新一轮融资,这件事给它带来不小的舆论争议。
2)监控全球“黑天鹅”事件,投资风险预警
越来越多金融机构实时爬取社交媒体内容数据,第一时间捕获全球突发事件,向机构发出避险预警,让风控人员提前做好避险或调整投资策略。
4.其他“另类数据”
1)小区21点后开灯率:分辨小区的投资属性or居住属性
通过数小区晚上9点以后的开灯率,来判断该小区是被有投资需求的人购买,还是有真实居住需求的人购买。
2)厂区物流频次:判断上市公司是否财务造假
著名的“做空”机构浑水公司曾经“狙击”一个中概股:东方纸业,认为存在财务造假,它是如何发现的?
据称,浑水曾派人蹲点东方纸业厂区的生产经营活动,发现从物流的情况来看90分钟内仅1、2量车出入,与其财报所示的销售规模不成比例,东方纸业存在严重夸大收入的行为。
“另类数据”服务商
1)RS Metrics
面向企业和投资者的卫星图像和地理空间分析的市场领先公司。
该公司拥有专利的专利技术利用先进的计算机视觉和机器学习,从各种基于位置的来源中提取有意义和现成的数据,为金融服务、房地产、零售、工业、金属、政府和学术研究中的决策提供预测分析、警报和最终用户应用程序。
2)Thasos
全球手机的位置信息转化为实时客观和行动支持型洞察见解的另类数据智能公司。
3)Dataminr
主要帮助商业机构和政府用户从社交媒体中提取他们想要的信息。
其司与 Twitter 达成战略合作,综合 Twitter 用户的位置、信誉,以及相关的新闻外链、市场容量和市场价格等信息,找出对特定企业客户比较关键的那些推文,然后对企业客户发出预警。
这种突发事件预警机制对新闻业、金融业和公共事务尤其有用。
4)Sandalwood
Sandalwood 咨询是全球领先的大数据分析服务商。其为资深投资者,提供基于另类数据分析的专业的中国消费者数据洞察。
5)Yipit Data
YipitData为机构投资者提供实用的网络数据情报。它专门开发系统和方法来收集数百TB的公共数据,从而对当前的公司指标和性能进行精细分析。YipitData两年前正式推出,目前覆盖65家公司,并与世界80多家顶级基金和资产管理公司合作。该团队位于纽约,拥有超过75名员工,其中包括数据分析师,研究分析师和数据工程师。
6)Thinknum
随着越来越多企业将商业行为进行线上化,新的数据资产正在形成,而这些数据将为我们更好地观察这些公司提供帮助。Thinknum 将所有网络数据都集中在一个平台,为机构投资者提供严谨的数据服务和研究洞察。
参考资料:
1、得到邵恒头条《怎么从太空预测股价?》
2、CII芝加哥投资研究院《另类数据——量化交易中的数据革命》
想了解更多大数据应用解决方案?
欢迎添加八爪鱼顾问微信▼
服务提示