清华大学金融科技研究院孵化
金融科技与金融创新全媒体

扫描分享

本文共字,预计阅读时间

对于普通的投资者来说,当面对如今市场上纷繁复杂的投资品种,如何选择如何盈利确实是令人非常头痛的问题。在之前的大牛市行情出现之时,电视银屏上陆续出现了一些股票投资推荐的节目,在一些纸质媒体中也有类似的栏目。但是一些分析师通过这样的一些媒体欺骗投资者谋取个人利益,从而导致了这样的节目和栏目的公信力受到了质疑。伴随着这样的背景以及行情的不景气,很多投资者已经放弃了这种原始的信息获取方式。后来如和讯网这样的网络金融媒体逐渐出现在公众的视野里,但是大多的普通投资者仍旧很难从众多的网页信息中提取出有用的信息,更不用说利用这样的信息获取额外的利润。近几年来,网络上投资者社区逐渐兴起,投资者社交平台"雪球"更是许多人挖掘财富的圣地,一些"雪球大V"推荐的股票确实给关注他们的投资者带来了颇丰的获利,但是投资者利益受损的情况也有发生。即使是"大V"之间也常常有看法相左的情况出现,对于普通投资者来说,在这样的情况下如何判断信息的质量仍旧是一个难题。

那么面对网络媒体中潜在着的大量信息,普通投资者真的无法利用么?大数据是时下的流行词,利用大数据挖掘的方法,我们能够发现很多隐藏的关联。那么,我们能否利用网络媒体大数据,从而获得额外的收益呢?德克萨斯州大学奥斯汀分校的Paul Tetlock教授提供了一种解决策略。

"投资者情绪"(Investor sentiment)

在各种财经新闻中,我们常常会看到"投资者情绪"这个词汇,但是投资者情绪是怎样的一种情绪呢?对于作为个体的人来说,我们可以根据这个人的表情、行为等等来判断这个人所处的情绪。但是有些情况下,即使是对于简单的个体我们也很难分辨他的喜怒。而投资者作为一个人群,如何衡量他们的情绪则是一个更为复杂的命题。对于资本市场来说,我们所关注的"投资者情绪"和一个人的情绪又有所不同,我们所更为关注的往往是投资者这个整体对于市场的或乐观或悲观的预期。

事实上,对于"投资者情绪"这个概念,我们能够感受到它的存在,譬如在金融危机期间,媒体上常常可见的是"投资者悲观情绪"这样的用法。直观上,我们也能够理解,在经济不景气的情况下,投资者往往更为谨慎,不愿进行更多的投资。虽然我们能够理解投资者情绪,但是,作为一个非常抽象的概念,我们很难去对它进行量化。在现今的各大财经媒体中,我们也很难发现一个明确的"投资者情绪指数"。显然,了解"投资者情绪"对于在资本市场上获得更高的收益率是有帮助的,一些分析师往往借助成交量、市场波动等市场信息对于"投资者情绪"进行近似的量化,但是学界对于这样的量化手段评判不一。

媒体指数(Media factor)

Paul Tetlock教授在一篇发表在Journal of Finance的文章中提出了一种新的衡量投资者情绪的方法--运用媒体指数(Media Factor)。那么他的这一"媒体指数"是如何得到的呢?

著名的华尔街日报(WSJ)是很多投资者的重要资讯参考,是美国发行量最大的财经类刊物。"了解市场"(Abreast of Market)是华尔街日报中的一个专栏,主要介绍前一日的市场事件和其他重要的市场数据。当然,这个专栏中也会有一些对于今日市场的预判。在华尔街日报的网站上,这一专栏每日也会进行更新,并和纸质版内容保持一致。Paul Tetlock教授正是利用这个网络专栏的数据,提炼得到了媒体指数这一指标。

他首先收集了1884-1999年16年的"了解市场"专栏的文章内容,并把这些内容进行词汇划分。哈佛大学心理学词典(Havard IV-4 psychosocial Dictionary)将能够词汇划分为77类,这77类词汇分别体现了一个人通过语言体现出的心理倾向,如肯定、否定、乐观、悲观等等。比如good就是一个简单又典型的肯定词,再如No就是一个典型的否定词汇。在媒体的文字中,譬如"了解市场"这个专栏中,如果作者用的属于否定或者悲观词类的词汇较多,显然就体现出作者对于市场并不看好。在这个词典中,某一个词汇可能属于多个类别,比如able这个词汇就同时属于肯定(Positive)和强烈语气(Strong)这两个词类,分别体现认同和强烈确信两种心理。哈佛大学心理学词典被广泛的应用于语义学和相关的金融研究中。

Paul Tetlock教授根据这一划分标准,对于每一篇文章计算其中相应词汇的比例,得到了一组数据。在此基础上,他利用主成分分析(Principal Component Analysis)的方法,得出了媒体指数(Media Factor),这一指数能够最大程度地体现出这组数据的变化特征。换句话说,透过这个指数的波动,我们能够发现媒体对于市场的态度的变化。这个指数的波动复制了市场情绪的波动,因为我们已经通过数据挖掘的方法把情绪数字化了。而通过统计学分析,这个指数的变化和"悲观"(Pessimism)这一类词汇的变化最为相关,因此也被作者称为"悲观指数"(Pessimism Factor)。

这个"媒体指数"或者说"悲观指数"又有什么样的作用呢?Paul Tetlock教授通过统计学方法,得出了以下几个结论:""悲观指数"的变化会显著的改变当天美国股票市场的收益和成交量分布。更高的"悲观指数"可能引发价格的下行,但是在未来的一段时间里,因"悲观指数"影响而下降的价格会缓慢的回升到原来的水平。除此之外,过高或者过低的"悲观指数"可能会引发暂时的市场的交易量的增加。

那么,这样的一个单纯通过语义学划分得到的数据得出的"媒体指数"为什么会和股票市场相关呢?在资本市场中,网络媒体扮演着非常重要的角色。媒体向公众传播信息,媒体表达大众对于某一事件的态度。财经媒体在资本市场上一手为投资者提供市场资讯,一方面又有一些对于资本市场动向的分析和预测。很多研究非常关注媒体对于资本市场带来的冲击。Cutler等人1998年发表的What moves stock prices?一文第一次研究了新闻媒体的报道对于股票价格的影响。 近期也有研究表明媒体会对于交易量产生影响。 对于这样的媒体的影响的产生原因,不同的理论有不同的解释,一种理论认为媒体会体现出"投资者情绪"并有一定的预测作用,因此,在这样的情况下,当出现"悲观的投资者情绪时"会引起投资者对于证券价值的负面预期,从而引起抛售,大量的抛售将会降低市场上的证券价格。也有理论认为媒体中包含着一些之前投资者并不知晓的"负面的信息",投资者通过获取这样的信息,从而对于市场上的证券价格作出新的判断,对于一些证券进行买进或者卖出,从而改变了相应的证券的价格和交易量。当然,也有理论认为媒体中并没有新的信息,不过是一些已经被知晓并体现在证券价格中的信息,只不过一些投资者对于这些信息过度反应,从而导致了证券价格的波动。在这里,我们暂且不关注这样的一些理论孰是孰非,我们能够认定的是,媒体的确能够通过某种机制对于投资者的情绪构成影响,让投资者产生对于市场的新的判断,从而对于市场价格和交易量构成影响。因此,Paul Tetlock教授得出的这一"媒体指数"事实上是对于投资者情绪的一种量化描述。

那么这样的量化描述对于投资者有什么样的意义呢?Paul Tetlock教授据此提出了一种相应的交易策略:在"悲观指数"高于平均时卖出,因为过高的"悲观指数"往往预示着市场上即将到来的下跌。在"悲观指数"低于平均时买入,因为这时往往市场情绪乐观,价格将会走高。这样一种投资者策略通过计算机就可以实现,而Paul Tetlock教授通过这一投资策略构建的投资组合获得了7.3%的年收益,显著高于同期的市场平均水平。这样的模型构建过程并不复杂,能够通过简单的计算机程序实现。通过简单的程序,我们甚至能实现证券的自动买卖,而对于普通投资者来说,如果我们能够拥有这样的分析程序,那么我们也能够获得超出市场水平的收益。

对于网络媒体来说,因其信息已被数字化,所以更容易利用这些数据进行分析和挖掘。Tetlock教授的这种利用网络媒体数据的分析只是众多尝试中的一种。陈海亮、胡宇等发表在Review of Financial Studies上的文章通过分析网络社区中的数据,同样利用哈佛大学心理学词典的分类对于社交媒体上发布文章及评论进行大数据挖掘,也得到了另外一种普通投资者可行可靠的获取额外收益的方式。这些有益的尝试向我们证明了网络媒体中可能蕴藏的丰富财富,也再一次向我们展示了大数据和网络结合能带来的巨大能量。

[Source]

本文系未央网专栏作者发表,属作者个人观点,不代表网站观点,未经许可严禁转载,违者必究!

本文为作者授权未央网发表,属作者个人观点,不代表网站观点,未经许可严禁转载,违者必究!

本文版权归原作者所有,如有侵权,请联系删除。

评论


猜你喜欢

扫描二维码或搜索微信号“iweiyangx”
关注未央网官方微信公众号,获取互联网金融领域前沿资讯。