量化投资之父西蒙斯:模型就是个黑箱!但还是请跟着数据走

湛庐图书&《财经》投资家   

2021年04月12日 11:20  

本文2306字,约3分钟

文/格里高利·祖克曼

(以下内容节选自《征服市场的人》一书)

时至1987年,卡莫纳已经自觉羞愧难当。卡莫纳的报酬是从埃克斯的个人奖金中列支的,但他却尚未给公司做出什么贡献。他决定暑期的时候全职在Axcom公司工作,期望更多的时间投入可以换来更好的模型改进,但他依然没有取得实质的进展。尽管埃克斯和斯特劳斯并不介意,但卡莫纳自己感觉很糟糕。“我感觉自己是吃白饭的。”卡莫纳说。

一天,卡莫纳有了一个想法。Axcom公司已经用了各种方法来运用他们的模型,比如依赖突破信号和运用简单的线性回归。线性回归是很多投资者用来分析两个数据或者变量集合之间关系的一种工具,隐含的假设是这种关系可以线性外推。比如你把石油价格作为x轴,把汽油价格作为y轴,然后根据散点图画一条回归线,延长这条线,你就可以在某一石油价格水平下轻松预测出对应的汽油价格。

然而,有时候市场并不那么听话。简单的线性回归模型通常无法有效地预测复杂而波动的金融市场价格走势,这些价格可能会受到暴风雪、恐慌盘和地缘政治等因素的严重冲击。同时,斯特劳斯此前已经收集了几十个各个历史时期的商品交易数据的集合,卡莫纳认为需要用回归的方法来找出这些市场数据之间的非线性关系。

卡莫纳建议尝试一种不同的方法:让计算机自己来寻找这些数据间的关系,从而找到过去某个相似的交易环境,然后观察价格的表现,这样他们就可以开发一个复杂但更为准确的预测模型来识别隐藏的价格趋势。

为了让这个方法付诸实践,Axcom公司需要大量的数据,远比斯特劳斯收集的要多得多。为了解决这个问题,斯特劳斯开始挖掘数据,而不仅仅是收集数据,比如,针对历史数据断档问题,他利用计算机模型做出相对可靠的猜测,以填补空白;再比如,他们没有收集到20世纪40年代的棉花价格数据,但是通过模型“创造”出的数据也许能够派上用场。就如同可以根据已有拼图来推断丢失的那块拼图大致长什么样一样,他们“推断”出了丢失的数据和信息,然后输入了数据库。

卡莫纳建议让模型自己来消化所有的数据,并给出买卖的指令。在某种程度上,卡莫纳是在创建早期的机器学习系统。模型会基于复杂的数据结构、集群和相关性给出对各种商品价格的预测,这是卡莫纳他们无法理解也无法用肉眼观察到的。

在别处,实际上统计学家们也在使用类似的方法,该方法被称为“核方法”,可以用来分析数据模式。此前已经回到长岛的亨利·劳弗也在自己的研究中运用了机器学习的方法,并正准备分享给西蒙斯他们。卡莫纳不知道这回事,他只是想运用复杂的算法给埃克斯和斯特劳斯提供一个框架,以识别当前和过去数据中相似的模式。“你们应该试试这个。”卡莫纳催促同事们。

当埃克斯他们把这个方法分享给西蒙斯的时候,西蒙斯怔住了。过去依赖线性方程组的模型给出的投资和资产配置建议是西蒙斯可以理解的,但卡莫纳的模型给出的结果,其背后的逻辑是未知的,因为卡莫纳的方法并不是基于简单的可以被写成标准方程组的数学模型。卡莫纳的结果是来自计算机程序对于未知数据模式的自动挖掘,即计算机在运算了几个小时后直接给出的结果。对西蒙斯来说,这听起来就不太对劲儿。“我觉得这听起来就让人不舒服,”西蒙斯有一天跟同事们说,“我不理解为什么模型一直要求买入而不是卖出呢?”后来,西蒙斯越来越恼火。“这就是个黑箱!”西蒙斯愤怒地说。卡莫纳同意西蒙斯的评价,但是他依然很坚持。“跟着数据走,西蒙斯,”卡莫纳说,“这不是我的意思,是数据的意思。”

埃克斯已经和卡莫纳成了不错的朋友,也成了这种方法的“信徒”,他自然站在卡莫纳这一边。“它的效果不错,西蒙斯,”埃克斯对西蒙斯说,“这恰恰是合理的……因为人类无法预测价格,就让计算机来做决策吧。”其实这正是西蒙斯一开始就想要做的东西,然而他仍然无法完全相信这种激进的方法。西蒙斯理智上觉得应该完全依赖模型,但他的心似乎还不能完全认同。“西蒙斯想弄清楚模型到底在干什么,”斯特劳斯回忆道,“他并不是很喜欢这种利用类似核方法而开发出的模型。”

渐渐地,斯特劳斯和同事们又找到了更多的历史价格数据,以帮助埃克斯开发基于卡莫纳方法的预测模型。他们后来甚至找到了19世纪以来的股票交易周度数据,这是其他任何人都没有涉足过的。当时,他们还不知道如何充分利用这些数据,但是这种搜寻历史数据并据此观察市场对特殊事件反应的能力,后续会帮助西蒙斯团队开发出可以利用市场意外冲击或崩盘获利的模型,帮助公司在特殊时期跑赢市场。

当Axcom公司开始测试这种方法的时候,其投资业绩迅速得到了改善。公司开始采用高维的核回归方法,这种方法更适用于趋势模型,或者更有利于预测某个投资品种趋势的持续性。

西蒙斯确信埃克斯他们可以做得更好,卡莫纳的想法确实帮助了他们,但这远远不够。西蒙斯经常来电来访,想要帮助Axcom公司提升业绩。西蒙斯通常扮演的是“蓄水池主管”,他要为基金找到高净值的客户并且哄他们开心,让他们愿意参与具有高科技含量的投资,这部分投资要占到公司1亿美元管理规模的一半。

为了得到更多数学方面的支持,西蒙斯还安排了一位颇有声望的学者为公司提供咨询。这个举动为公司的历史性突破埋下了伏笔。