摘要
通过使用美国公司定期提交的季度和年度报告的完整历史记录,我们发现财务报表的语言和结构的变化对公司的未来回报和运营有很大的影响。卖空 “改变者” 并买入 “未变者” 的投资组合在未来每月最高在alpha上赚取188个基点 (每年超过22%)。此外,10-Ks(每年的财务业绩综合报告)的变化预测了未来的收益、盈利能力、未来的新闻公告甚至未来公司层级的破产。与典型的反应不足模式不同,我们没有发现公告效应,这表明投资者对众多上市公司的简单变化并不关注。
在Grossman和Stiglitz(1976)的描绘里,代理商对他们收集、处理和提取到的价格信息的边际价值进行了补偿。尽管这个模型是静态的,但随着时间的推移,这些潜在过程的动态变化对投资者来说是巨大的。在过去的三十年中,信息生产和传播的成本大幅下降。随着成本的降低,产生的信息量增加,使得搜索和处理问题更加复杂。如果投资者没有跟上这些变化的规模和复杂性,披露的信息可能不会被Grossman-Stiglitz投资者采纳。
本文中,我们使用公司的年度报表来研究这种紧张关系。以前的文献记载,虽然投资者一度对包含重大变化的财务报表做出了即时回应,但在今天这种公告效应不太明显(Brown and Tucker (2011), Feldman et al. (2010))。因此,该文献得出结论,随着时间的推移,10-K文档的更改变得不那么具有信息价值。虽然我们引用了“常规文件的更改没有显著的公告效应”这一观点,但是我们证明出这一结果遗漏了这些变化对资产价格影响的重要组成部分。
特别是,我们发现缺乏公告收益不是由于财务报表随着时间的推移变得越来越没用,而是也许是因为报告增加了复杂性和长度,导致投资者在发布年度报告时错过了这些微妙但重要的信号。当我们使用我们的方法隔离公司报告的更改时,我们发现文档更改确实以一种巨大而重要的方式影响了股票价格,但它们却滞后了:投资者逐渐发现文件变化中包含的消息的含义,可是最终这些消息的影响被股票价格和公司运营所覆盖。先前的研究认为公司文档的信息量越来越少,因此对当今资本市场的投资者的用处也越来越小,与此相反,我们的结果表明,10-Ks包含了丰富的信息,但投资者最初忽视了很大一部分信息。因此,本文的研究结果为投资者提出了一种极广泛的关注方式,季度和年度报告是公司报告过程的基础,这带来了很大的回报可预测性。
为了解决Grossman-Stiglitz投资者在收集和处理价值敏感信息上所面临的日益增加的困难,我们标出了以文本单词的数量来衡量的公司年度财务报表的平均大小 (10-K),即在我们的样本期内,剥离表格、ASCII嵌入的信息、jpeg文件等之后,仅关注实际文本大小。从面板A中可以看出,在过去的20年中,平均10-K的长度急剧变大,今天的10-K几乎数倍于1995年的数据。面板B显示,在同一时期,文本更改的数量也大幅增长,增长了12倍以上。因此,不仅10-Ks的长度增加 (即包含更多的文本),而且更改的数量也逐年增加。我们把这些用作背景来探索投资者如何应对信息传递的这些变化,以及这些信息最终如何转化到股票价格和公司运营中。
为了介绍我们的方法,我们以百特国际公司为例。百特是一家生物科学和医疗产品公司,总部位于伊利诺伊州迪尔菲尔德。该公司成立于1931年,在纽约证券交易所交易 (股票代码: BAX),并且是标准普尔500的成员。该公司的年度报告 (10-Ks) 在历史上一直是相似的,但是在2009年,当其同比相似性分数下降时,情况发生了变化。5
是什么导致百特2009年的10-K在使用的语言和提供的信息方面偏离了前一年?图2表明,在2010年2月23日发布2009年10-之后的几个月中,一些新闻头条充斥着媒体。例如,纽约时报在2010年4月24日上发表的一篇文章报道说,美国食品和药物管理局 (FDA) 正在打击医疗设备,特别是用于运送食品和药品的自动静脉输液泵。从文章说: 输液泵的最大制造商包括Baxter Healthcare of Deerfield, Ill.;Hospira of Lake Forest, Ill.; 和CareFusion of San Diego。文章继续引用FDA官员的话说,新的更严格的法规将减缓FDA对自动泵的批准程序。然后,在5月4日 (仅仅10天后),纽约时报 报道说,试图解决电池故障和软件错误等问题,FDA根据与联邦监管机构的协议对巴克斯特进行了大规模召回,百特国际正在从美国市场召回其Colleague infusion pumps。6
百特国际 (Baxter International) 的股票回报在纽约时报 (New York Times) 的文章公布前后发生了很大变化。在发表文章的两周内,百特的价格下跌超过20%。这在图3中进行了描述,该图还表明价格保持低迷,在随后的六个月内没有恢复。相比之下,在新闻发表前近两个月,我们观察到巴克斯特自己在2010年2月23日上披露的10-K没有明显反应。
那么问题是,这两个信息发布是否完全链接在一起,也就是说,百特两个月前公布的10-K的某些变化可能会有暗示了有关自动泵问题的重要消息。图4提供了该方向的一些暗示性证据,百特10-Ks中的关键字眼与FDA的打击和百特的召回有关联。图4显示,相对于前几年,百特在其2010报告中对这些词的使用激增。特别是,百特2009文件中对“FDA”的提及增加了71%,对“召回” 的提及增加了50%,对“Colleague infusion pumps”的提及增加了182%。图5在这一点上提供了更详细、更具暗示性的证据:通过提供一些从2009版本到2008版本的平行的段落,来证明百特越来越多地使用这些术语。例如,人们可以看到,百特改变了这一段落:“有可能在未来期间需要与COLLAGUE相关的额外费用”[2008]、“有可能在未来期间需要大量与COLLAGUE相关的额外费用,包括重大资产减值 ”[2009]。百特还在他们的2009年的10-k中添加了以下内容: “我们产品的销售和营销以及我们与医疗保健提供者的关系正受到联邦政府和外国政府机构的越来越多的审查。FDA、OIG、司法部(DOJ) 和联邦贸易委员会都加大了执法力度…”
回头看看,关注百特10-K的变化会对公司的投资者产生影响吗?回到图3,答案似乎是肯定的。百特的股价不仅在公开提交2009年度10-K的日期 (2010年2月23日) 中根本没有变动,而且在接下来的两个月里也没有变动。直到纽约时报4月23日的新闻报道。在纽约时报文章发表前两个月的任何时候,了解百特这些负面变化并通过做空付诸于行动,将为投资者在新闻发布后的一个月内带来超过30% 的回报。
我们发现,于1995年2014年这个横截面内所有在美国上市的公司,这种行为模式、投资者反应、后续事件和回报演变都是系统性的。
我们首先发现,更改报告的公司的未来股票收益显着降低。特别是,一个做多“未变者”、做空“改变者”的投资组合,在第二年的价值加权异常收益中,统计上每月显著赚取34至58个基点,每年最高7% 个基点 (t=3.59)。这些回报持续累积长达18个月,并且不会逆转,这意味着这些变化远非反应过度,对于那些在报告变化后几个月才逐渐纳入资产价格的公司来说,这些变化暗示着真实的基本信息。由于所有上市公司都被要求提交10-Ks (和10-Qs),我们展示这些异常收益的样本确实是真实公司的集合 (不是一个小的、非流动性的或以其他方式选择的子集)。
我们认为,这些发现无法用传统的风险因素、众所周知的未来回报预测指标、意外的收益或与这些公司披露时间相吻合的新闻发布来解释。此外,我们在整个样本中发现了经济上和统计上为零的公告日回报 (很像百特公司)。这与渐进式的信息扩散形式解释相反,这种解释与许多其他规律性的经验模式 (例如,收益后的公告漂移,动量等) 相一致,在这种解释中,一个大的即时响应之后是在同一方向上的适度但持续的漂移。相反,我们记录的模式与投资者只是没有解释或关注公司年度报告的简单更改中包含的系统和丰富信息更为一致。在公司公开申报时,股票价格几乎没有反应,即使存在稳健和系统的关系 (即变化预测未来的负回报和负的实际 *** 作实现),而信息仅在未来被投射到价格中。
接下来,我们探索这些回报结果背后的作用机制。我们发现,公司的报告变更集中在管理讨论与分析 (MD & A) 部分,即报告中管理层在内容方面拥有最大的自由裁量权和灵活性的部分。然而,从收益丰富的内容来看,我们发现,虽然MD & A部分措辞的变化确实预示着巨大而显著的异常收益,但风险因素部分文本的变化对股票收益的信息更为丰富。例如,风险因子部分中的五因子alpha (未变者-改变者) 每月超过188个基点 (t=2.76),或每年超过22%。此外,我们发现,涉及高管 (首席执行官和首席财务官) 团队或诉讼和官司的语言变化对未来的回报特别有效,因为它越来越多地使用所谓的 “负面观点” 一词。例如,报告中有关诉讼和官司变化的公司每月比未变者低71个基点,或每年超过8.5% 个基点 (t=3.29)。接下来,我们转向实际活动的度量,并表明10-Ks的变化可以预测未来的收益、盈利能力、未来的新闻公告、甚至未来的公司层级的破产。此外,就像回报实现一样,这些似乎在很大程度上是意料之外的,因为涵盖该公司的分析师没有考虑实际的运营变化,这导致10-K中的变化显著地预测了未来的负收益意外和围绕这些事件的负累积异常回报 (CARs)。
请注意,理论并不能预测变化一定会导致负回报。公司在其10-K文本中做出积极的改变在事前可能很合理,而这些改变被投资者忽略,随后导致收益和公司结果的积极实现。因此,对未标记文本的 “更改” 的添加将是模棱两可的。有两个证据表明,我们在数据中记录了与收益和未来结果有关,被显著观察到的负面关系。首先,当我们使用自然语言处理 (NLP) 文本签名的基础文本的变化,我们注意到86% 的变化由 “负面” 事件变化组成。当我们分离出 “积极” 变化的14% 时,我们确实发现它们预测了未来的显著正回报。其次,也许是造成负面 (坏消息预示) 变化的比例不成比例 (86:14) 的一部分,集体诉讼诉讼主要是声称对现有股东遗漏负面新闻 (即,卖空者没有成功地起诉公司,因为他们没有及时恰当地披露实质性的积极信息)。这将不对称地增加未能报告负面信息的风险,从而导致观察到的变化的不对称实现。
我们对公司规模、时间、行业、公司活动等进行了稳健性测试。我们记录的影响不是由这些因素驱动的。特别是,结果不是由特殊的公司事件 (例如,M & A,SEO或其他可能需要改变10-k的大型公司事件) 或公司的某些行业的类型或特征驱动的。此外,我们发现的影响似乎不是交易成本或套利限制的函数。我们记录的回报结果具有以下特征: 它们在10-K发布后的 几个月 内累积 (因此不需要高频交易); 投资组合的营业额非常小 (在不频繁的报告日期附近); 这些影响体现在所有上市公司的价值加权回报中 (因此并不集中在小公司中); 平均“改变者”公司 (将被做空) 实际上是大于35亿美元市值的平均多头 (对25亿美元),而且,平均“改变者”公司的做空费用相对较小,实际上,做空的成本也比做空多头组合中的平均股票要低。
我们的发现也不仅仅由这些文件的长度的变化所影响。如上所述,虽然10-Ks观察到长度随着时间的推移而大幅增加,但当我们控制文件长度和文件长度变化时,我们在文件中测量的变化的影响是回报的重要预测指标。总而言之,控制长度的变化以及其他特征和事件 (例如,发行,应计项目等),实质性改变公司10-K的行为仍然是未来收益和实际公司运营变化的经济大且统计上可靠的预测指标。退一步讲,从某种意义上说,与数字财务报表条目相比,这些结果要求投资者在文本方面有不同的 “功课”。特别是,财务报表中的几乎每个表都显示了当年的数字以及过去几年的一系列可比报告数字。 例如,如果没有前几年的销售收入,15亿美元的销售收入将意味着什么。相比之下,投资者不会将今年的文本与去年的文本进行相同的比较。正如我们在整篇论文中所展示的那样,这种简单的比较包含了有关公司未来运营的丰富信息。
为了更深入地参数化和检查投资者的行为,我们理想地假设投资者将更多注意力分配到公司的10-Ks上,尤其是对10-Ks的变化。尽管从历史角度来看,这很难或无法衡量,但我们尝试使用美国证券交易委员会 (SEC) 的新颖数据来做到这一点。具体来说,我们向SEC提交了信息自由法 (FOIA) 请求,以获取数据文档: (i) 从SEC网站EDGAR (电子数据收集,分析和检索) 下载服务下载的每个文件,(ii) 指示下载文件的确切时间戳,和 (iii) 下载者 (部分匿名) ip地址。从这些信息中,我们构建了一个面板数据集,每个投资者随着时间的推移下载活动 (哪些文件和时间) 的10-K。我们使用这些数据来识别10-k版本 (例如,苹果2011年),其中很大比例的投资者不仅下载了本年度的10-K,而且同时下载了上一年的10-k。考虑到他们的联合下载,这些投资者似乎有更高的可能性想要比较两者,而不是大多数投资者仅下载今年的10-K文件。我们发现,当更多的投资者潜在地比较10-Ks并关注变化时 (通过降低今年和去年的10-k),这减弱了我们在本文中记录的关键收益可预测性效应,最后,我们调查了这种注意力不集中的性质,并表明当投资者通过文本中包含的比较陈述明确地吸引到这些变化时,投资者更容易消化质变 (例如,与上年息税折旧及摊销前利润或与去年相比等报表)。从这个意义上讲,我们的论文通过指出哪些特定的短语和语言模式可以帮助投资者提高其处理文本信息的能力,从而记录了有关投资者注意力不集中的起源和特征的新的、详尽的证据。
本文的其余部分组织如下:第一部分提供了简要的背景和文献综述。第二部分描述了我们使用的数据,并探讨了公司年度和季度报告的构建。第三部分研究了这些选择的影响,第四部分更详细地探讨了驱动我们结果的机制。第五部分总结。
背景及相关文献我们的论文对一些不断增长的文献做出了贡献,包括但不限于: (i) 股票价格反应不足的大主题及其影响投资者的不关注; (ii) 在财务和会计中使用文本分析; (iii) 公司信息披露选择的信息含量。
我们的收益可预测性结果的规模和性质为现有的股价反应不足和注意力不集中研究增加了新的证据和急需的粒度。如Tetlocks (2104) 评论文章所述,有几篇论文表明,当投资者未能关注信息内容时,反应不足最为强烈。例如,Tetlock(2011)构造了陈旧新闻故事的度量,并证明了投资者对陈旧信息反应过度,对新颖信息反应不足。DaEngelberg和Gao(2011)使用Google搜索活动来确定散户投资者的注意力,而Ben-Raphael,Da和Israelson(2017)使用彭博搜索活动来衡量机构的注意力。后者表明,对于机构关注度最低的股票,股价漂移最为明显。另一个新颖的关注指标是英格堡、萨斯维尔和威廉姆斯(2012),他们显示吉姆·克莱默疯狂货币秀期间电视收视率的飙升 (大概是由散户投资者推动的) 与节目期间推荐的公司股价反应过度有关。相比之下,在本文中,我们记录了一种严重的投资者注意力不集中形式,它影响了公司的大部分横截面,集中在公司进行的最重要的公司披露上,并导致了较大的回报可预测性。此外,我们使用SEC日志文件中的新颖数据来证明对这些相同项目 (年度报告) 的关注变化会导致这些回报可预测性模式的变化。最后,我们深入研究了这种注意力不集中的性质,并表明,当投资者通过文本中包含的比较陈述明确地吸引这些变化时,他们更容易消化质变 (即文本中的变化,而不是数字); 当不包括此类比较时,投资者根本没有发现这些文件的有意义的变化。我们的证据表明,对投资者来说,不仅是定量信息和定性信息之间的差异 (如英格堡 (2008)),而且定性信息的构建和呈现方式也是如此。因此,我们的论文有助于微观发现一些关于注意力不集中和通过澄清投资者未能认识到的确切含义,股价反应不足。
在尝试识别文档级别的文本更改时,我们的论文还为文本分析的庞大且快速增长的领域做出了贡献。由于计算能力的提高和NLP领域的进步,许多最近的论文试图采用文本分析的自动化形式来解决财务和会计中的重要问题; Loughran和McDonald(2006)对其中一些论文进行了有益的调查。与我们的研究最相关的是分析公司披露中文本信息之间联系的文章 (例如我们的分析的10-ks和10-qs) 以及公司的行为和绩效。例如,Li (2008) 采用了一种形式的文本分析,发现收益较低的公司 (以及收益为正但持续收益较低的公司) 的年度报告更难解释。Li (2010) 还发现,MD & A部分的前瞻性陈述中的公司语气可用于预测未来的收益意外。同时,Nelson和Pritchard (2007) 探索了使用警告性语言,该语言旨在援引《私人证券诉讼改革法案》1995年下的安全港条款,并发现遭受诉讼风险增加的公司相对于前一年更大程度地改变了警告性语言,但在诉讼风险降低后,未能删除以前的警示语。此外,费尔德曼等人。(2010) 发现MD & a部分中的积极基调与适度较高的同期和未来回报相关,而日益消极的基调与较低的同期回报相关。在我们的论文中,我们证明,即使在控制了披露情绪的任何影响之后,我们采用的文档相似性度量也可以预测未来的收益。
最后,在研究不同类型的公司倒闭的影响时,一些其他论文探讨了公司级别年度报告的其他方面。例如,Lee (2012) 发现,对于具有更长或更少可读性10-q的公司,在10-q申请后的三天内,与收益相关的信息被合并到公司股价中。同时,Dyer,Lang和Stice- Lawrence (2017) 表明10-ks变得更长,更复杂,并研究了这些趋势背后的一些原因。也许与我们的论文最接近的是Brown和Tucker (2011),他们专注于MD & A部分文本中的同比变化,并发现此部分中的变化与未来的运营变化有关 (例如,基于会计的绩效指标,以及流动性措施)。他们还发现,在10-k申请日期附近的同期回报在MD & A的变化中不断增加。重要的是,布朗和塔克 (2011) 报告说,虽然MD & A的披露随着时间的推移变得越来越长,但它们变得更像投资者在前一年看到的那样。..此外,我们发现,随着时间的推移,对MD & A修改的价格反应减弱了。.。表明MD & a的有用性下降。“相比之下,我们在本文中展示的是,10-ks的变化实际上对投资者非常有用,因为他们预测未来会有巨大的负回报。因此,虽然我们证实了他们近年来的发现,即与文档更改相关的公告效应接近于零,但 13 我们表明这 不是,因为文档更改变得不那么有用了。相反,这是因为投资者在发布年报时缺少了集中在年报中的微妙但重要的信号,这可能是由于其复杂性和篇幅的增加。使用我们的方法隔离变化,我们发现这些变化对未来的资产价格具有强大的可预测性。因此,我们的结果并没有像过去的文献所暗示的那样变得不那么丰富,我们的结果表明,10-ks和10-qs在当今仍然发挥着重要的作用。然而,这些文件中的丰富信息以及所传达信息的变化似乎在很大程度上被投资者所忽略。因此,价格启示只是随着时间的推移逐渐发生,资产价格和实际活动在文件更改后的未来6到12个月内反应缓慢。
数据和汇总统计我们从各种数据源中提取来构建本文使用的样本。我们首先从SECs EDGAR网站中1995年到2014年下载所有完整的10-K、10-K405、10-KSB和10-Q文件。所有完整的10-K和10-Q文件均采用HTML文本格式,并包含随每个公司文件一起提交的所有信息的汇总,例如展览,图形,XBRL文件,pdf文件和Excel文件。与Loughran和McDonald (2011) 类似,我们将分析重点放在文档的文本内容上。我们仅提取每个文档中的主要10K和10-Q文本,并删除所有表格 (如果其数字字符内容大于15%),HTML标签,XBRL表格,展示,ASCII编码的pdf,图形,XLS,和其他二进制文件。我们使用证券价格研究中心 (CRSP) 的月度股票回报,以及来自Compustat的公司股本和每股收益的账面价值。我们还从机构经纪人估计系统 (I/B/E/S) 获得分析师数据,并从Loughran和 McDonald (2011) 主词典中获得情绪类别标识符。
我们使用从语言学,文本相似性和NLP文献中采用的四种相似性度量来捕获10-Q和10-K文件之间的季度相似性: (i) 余弦相似性,(ii) Jaccard相似性,(iii) 最小编辑距离和 (iv) 简单相似性。我们在下面描述每个度量及其各自的计算。
第一个度量称为余弦相似性。Hanley和Hoberg (2010) 在金融文献中也使用了该度量,该度量是在两个文档D1和D2之间计算的,如下所示,令DS 1和DS 2分别是出现在D1和D2中的一组术语。将T定义为DS 1和DS 2的并集,并使ti为T的ith元素。将D1和D2的术语频率向量定义为
其中nDk(ti)是术语ti在Dk中的出现次数。然后将两个文档之间的余弦相似度定义为
其中点积是标量积, 范数是欧几里得范数。对于文本和数字示例,请考虑以下三个简短文本:
DA: 我们预计需求将增加。DB: 我们预计全球需求将会增加。DC: 我们预计销售疲软。很容易看出,DA与DB非常相似,并且DA与DB比DC更相似。DA和DB的余弦相似度计算如下: 并集T(DA,DB)为:
换句话说,Jaccard相似性度量被计算为交点除以两个术语频率集的并集的大小。请注意,Jaccard度量是二进制的 (每个单词在给定集合中仅计数一次),而余弦相似性度量包括频率 (包括每个单词的计数)。使用与上述相同的D A , D B , 和 D C,Jaccard相似性为
我们采用的第三种相似性度量 Sim MinEdit 是通过计算将一个文档转换为另一个文档所需的最小 *** 作数来计算的。再次使用DA、DB 和 DC,将DA 转换为DB 只需要在世界范围内添加这个词,在将 DA转换为 D C 时,需要删除“demand”、 “to”和“increase”三个词,并添加“weakness”、“in”和“sales”三个词。
最后,我们的第四种相似性度量 Sim Simple 使用了一种简单的并排比较方法。具体来说,我们使用Microsoft Word中的函数跟踪更改或Unix/Linux终端中的函数diff将旧文档 D 1 与新文档 D 2 进行比较。我们首先确定更改、添加和删除,同时将旧文档与新文档进行比较。为此,我们计算这些更改、添加和删除中的字数,并按旧文档 D 1 和新文档 D 2 的平均大小对总数进行标准化:
为了获得一个值介于 [0 , 1] 之间的相似性度量,其中一个意味着两个文档是相同的,就像前面的三个相似性度量一样,我们然后通过缩放 c 来归一化以计算 Sim Simple 为:
Sim Simple = [cmax − c] /cmax.
请注意,每个年度10-k报告包含15个时间表,每个季度10-q报告包含10个时间表。10-k和10-k的通用时间表10-q报告为: 管理层讨论和分析财务状况和经营结果,风险因素,法律程序,有关市场风险的定量和定性披露,控制和程序以及其他信息。这些10-k和10-q报告的时间表 (或项目) 列在图 6 中。我们通过捕获包含单词 “item” 和时间表名称的正则表达式来识别每个时间表的文本内容。由于各个文件之间的时间表标签非常不一致,因此我们多次处理所有10-k和10-q文件以捕获异常。首先,我们使用正则表达式来捕获计划标题的最常见结构: 以项目Item开头的行。然后我们捕获通用规则的例外,例如,只有项目开头item加数字加标题名称的行。同时还确保每个时间表被精确地捕获一次。我们多次重复此过程,并每次都合并新的异常。
表I显示了我们最终数据集的摘要统计信息,其中包括从SEC EDGAR网站下载的所有10-ks和10-q 1995年2014年。在面板A中,文档大小是每个报告中的单词数,更改大小是相对于先前报告更改的单词数 (在10-k的情况下,该变化是相对于上一年的10-k来衡量的,在10-q的情况下,该变化是相对于上一年的同一季度的10-q来衡量的)。我们发现,平均10-k包含44,430个单词,而平均10-q包含大致3分之1多的单词 (15,724)。
对于我们对该机制的一些测试,我们还从Loughran和McDonalds (2011) 主词典中绘制了情感类别标识符和单词列表 (例如,负面单词,不确定性,轻率等的度量)。在面板A中,变化的情绪 是由变化的大小归一化的否定词的数量,变化的不确定性 和 变化的诉讼性 分别是由不确定性和诉讼性分类的单词数量。变化的大小。最后,我们解析10-K/Q文档以提及CEO或CFO营业额,并将 变更CEO 和 变更CFO 定义为等于1的指标变量,如果10-k或10-q分别提及CEO或CFO的变更。更具体地说,我们搜索集合 {任命,选择,雇用,新,搜索} 中的单词和集合 {CEO,CFO,首席执行官,首席财务官} 中的单词出现在10个单词之内的情况彼此。该表显示,平均约2% 至5% 份报告中提到了首席执行官和首席财务官的变动。
表 I 的B组显示了四种相似性度量的汇总统计数据。每个度量的范围从零到一,但是四个度量的范围不同。例如,Sim余弦 度量的分布相当窄,具有0.87的平均值和0.20的标准偏差,而 Sim简单 度量的分布集中在更低的水平,具有0.15的平均值和0.10的标准偏差。回想一下,较高的值表示10-ks (或10-qs) 之间的年份之间的文档相似度较高,而较低的值表示文档之间的更改更多。另外,请注意,在将这些度量的任何异常值 (在1个 st 和99个 th 百分位数) 包括在我们的后续分析中之前,我们会对其进行排序。
表 I 的C小组报告了措施之间的相关性。尽管 Sim简单 和 Sim余弦 之间的相关性仅0.19,但所有四个度量之间的所有其他成对相关性均超过0.5。
报告行为变化的含义在本节中,我们将研究公司决定更改其SEC文件的语言和结构的含义。特别是,我们探讨了这些变化的性质及其对公司未来行动和结果的影响。
我们首先分析与大幅改变报告的公司和没有改变报告的公司相关的未来股票回报。首先,我们计算标准的日历时间投资组合。然后,我们通过采用Fama-MacBeth月度横截面回归来控制收益的其他决定因素。
日历时间投资组合回报对于上一节中描述的四种相似性度量中的每一种,我们每月根据上个月所有股票的相似性得分分布来计算五分位数。对于12月财政年度结束的公司,我们使用以下报告: 对于日历季度Q1,我们使用公司10-q的发布,通常发生在4月或5月; 对于日历季度Q2,我们使用公司10-q的另一个发布,通常发生在7月或8月中; 对于日历季度Q3,我们使用公司10-q的另一个发布,通常发生在10月或11月中; 对于年终结果,我们使用全年10-k的发布,通常发生在3月的2月。相似度得分是相对于前一年的报告计算的,该报告在日历时间上与所讨论的报告排成一行 (因此,例如,2005第一季度10-qs与2004第一季度10-qs进行比较)。股票在公开发布其报告后的一个月内进入投资组合,这导致我们的投资组合构建滞后。请注意,在我们所有的测试中,公司在投资组合中持有三个月。投资组合每月重新平衡。平均每月回报见表二。表 II 的A组显示了相等加权的日历时间投资组合收益。五分位数1 (Q1) 对应于今年和去年文件相似性最小的公司,因此,这个投资组合由 “大的改变者” 组成。五分位数5 (Q5) 对应于多年来在文档中具有最大相似性的公司,因此该投资组合代表了 “几乎没有改变者”。Q5至Q1是指多头-空头 (L/S) 投资组合Q5和每月短Q1。面板A显示,L/S投资组合每月获得18至45个基点之间的巨大且显着的异常收益。通过控制三个Fama-French因素 (市场,规模和价值),或两个额外的动量和流动性因素,这一结果不受影响。这些结果表明,我们在这些投资组合之间看到的回报差不是由对众所周知的风险因素的系统负荷驱动的。值得注意的是,所有四种相似性度量都提供了这种模式,这表明我们的结果不是由我们计算文档中逐年变化的特定方式驱动的。这一发现表明,在给定年份对其披露进行重大更改的公司的未来回报较低。公司不改变也与正的异常回报有关。在本文的后面,我们探讨了这一回报结果背后的可能机制。
表 II 的B组显示了按A组计算的价值加权的投资组合收益,但投资组合中的每只股票均按其 (滞后) 市值加权。B组显示,价值加权的投资组合收益与等加权结果相似,但幅度更大,价值加权的L/S投资组合每月收益高达58个基点 (t 3.59),这取决于所采用的相似性度量。投资组合回报价差在两边都显示出来,“改变者” (Q1) 未来回报为负,“未变者” (Q5) 未来回报为正。重要的是,互联网附录中的图 IA.3 绘制了表 II 中记录的年度超额收益时间序列,并显示正超额收益年限的数量在整个样本期内分布相当均匀,与本文中记录的异常收益不集中在几个季度或几年的观点一致。
我们使用图 7 中的事件时间收益来探索该投资组合的长腿和短腿的演变。从图 6 中的事件时间收益中可以看出,Q5长边的任何正alpha (小到无变化) 很快恢复为零,而负alpha持续存在并增加到六个月,永远不会逆转。图 7 的A组通过计算每个五分之一港口对开本的平均汽车来探索长期回报,该平均汽车基于公司的相似性得分 (这里使用 Sim Jaccard 度量) 从投资组合形成后的第一个月到第六个月。小组显示,信用证退货在随后的六个月内逐渐累积,并且不会逆转。此外,Q1 (“改变者”) 的长期糟糕表现在这个数字中特别强劲和持久。
然后,图 7 的B面板对L/S进行了更细粒度的观察
通过探索这些文件公开发布的事件时间公告回报 (从 t 10天到 t 10天) 来产生回报效果。该小组显示,就像百特国际公司的例子一样,这些文件的宣布没有统计或经济上可检测到的影响,而是我们在本文中记录的回报影响在接下来的六个月中逐渐累积,并且不会恢复。从整体上看,图 7 描述了公司决定显著改变其报告做法的信息对公司价值的长期影响,这种影响不是围绕报告的发布而产生的,而是随着时间的推移通过价格披露逐渐产生的。
五分位数投资组合的特征
表 II 和图 7 中记录的很大一部分回报价差来自空头的发现,这一发现引起了人们对L/S组合双方的构成及特点的探讨。例如,可能是这样的情况,即空头方仅包含一组较小的公司,这些公司很难做空 (且价格昂贵)。或者,可能没有大量的小型或流动性低的股票交易。这两种可能性都可能使我们记录的收益落入套利的简单限制之内。表 III 列出了所有五个五分之一投资组合的平均规模,营业额,做空成本 (以基点计) 和投资 (如表 I 中所定义)。可以看出,几乎没有证据表明空方平均包含一组不寻常的公司; 如果有的话,Q1的公司似乎稍大一些,平均做空成本较低。唯一值得注意的区别似乎在于公司文件文本的情感,我们将在下面更详细地探讨这一发现。此外,鉴于营业额非常小,价值加权回报比等加权回报大一点,我们的样本包括整个上市公司 (即,我们不会将注意力限制在一小部分公司或行业上,因为每个上市公司都被要求提交10-ks和10-qs),因此为每个五分之一的人产生大量多元化的投资组合,并且在接下来的六个月中,回报仅会缓慢增长几个月,我们认为套利的限制不会对观察到的回报规律做出重大贡献。
Fama-MacBeth回归接下来,我们将对许多已知的回报预测指标以及我们的四个相似性指标,对未来单个公司水平的股票回报进行月度Fama-MacBeth横截面回归。如表 IV 所示,每个相似性度量都是未来股票收益的积极且重要的预测指标,这意味着那些对其报告进行重大更改的公司的未来收益较低。当我们包括各种额外的回报预测指标时,这个结果继续保持不变: 上个月 (或最后一个季度) 标准化的意外收益惊喜 (SUE); Size,股票的对数市场价值; log(BM),股票的日志账面价值高于股票的市场价值; Ret( 1,0),前几个月的回报; Ret (12,2),从 t 月12日到t月2日,SUE被定义为基于Compustat的标准化意外收益,并按Livnat和Mendenhall (2006) 计算。Compustat意外收益是基于这样的假设,即每股收益遵循季节性随机游走,其中 t 季度每股收益的最佳预期是公司在上一个财政年度的同一季度报告的每股收益。就幅度而言,例如第 (12) 栏 (0.0292,t 2.11) 中 Sim Simple 的系数意味着,给定股票文件跨年相似性的一个标准差的降低,未来回报每月减少36个基点。
机制在本节中,我们将探讨关键回报结果背后的工作机制。
解释报告行为的变化首先,我们将相似性度量回归到描述相关文档的几个特征上。这项工作的目的是更好地理解哪些因素有助于解释给定公司加班文件的相似性变化。
我们构建基于特定单词的度量,以及基于可用单词词典的情感类型度量,特别是使用感类别标识符和单词列表 (例如,负面单词的度量,不确定性,诉讼性,等) 来自Loughran和McDonalds (2011) 主词典。我们将 变化情绪 构造为按变化大小归一化的否定词数; 变化的不确定性 和 变化的诉讼性 分别是按变化大小归一化的不确定性和诉讼性分类的词数; 如果10-k或10-q分别提到CEO或CFO的变化,则 变更CEO 和 变更CFO 作为等于1的指标变量。
表 V 显示了关于上述文档特征的文档相似性 (此处使用 Sim Simple 测量) 20 的面板回归结果,具有公司和时间固定的效果,以及在公司级别的聚类。结果表明,在文档之间的相似性较少 (即,更多的变化) 与更多 (负面) 情绪,更高的不确定性,更多的诉讼以及更频繁地提及首席执行官和首席财务官的变化有关。21 这些发现中的每一个都具有高度的统计学意义,它们共同暗示,我们确定的报告实践的变化与相关公司的运营或前景的重大变化有关。
在表 VI 中,我们探讨了我们的退货结果在多大程度上受文件各个方面的驱动,而不是我们对文件同比变化的具体衡量标准。例如,情绪低落,文档的长度或文档长度的变化可能是更重要的收益预测指标,或者可能会淘汰我们对 (dis) 相似性度量的预测能力。我们还构建了 变化情绪是积极的 这一度量,以关注我们记录的变化情绪,并将情绪的积极和消极成分分开。 结果表明,即使在控制了上述文档级别的特征 (在表 V 中设置的Fama-Macbeth月度回报可预测性中) 之后,相似性仍然是未来回报的重要且重要的预测指标 (t 3.82)。仅情绪的下降就可以预测负回报,就像文件长度的增加一样,但是这些措施都没有驱除文件相似性同比变化的可预测性。
2.隔离报告的关键部分
接下来,我们尝试确定季度报告和年度报告的哪些部分与给定公司的同比相似度下降幅度最大。
图 6 列出了公司年度 (10-K) 和季度 (10-Q) 报告中存在的标准部分。图 8,面板A,然后绘制公司10-ks中不同项目的平均相似性得分,并显示项目7(MD & A部分) 显示的平均相似度明显低于其他类别。值得注意的是,这是10-k的一部分,其中管理层可能对内容拥有最大的酌处权。同样,图 8,面板B,报告公司10-qs不同项目的平均相似度得分,并再次显示MD & A部分 (此处为项目2) 与报告中的其他项目相比显示了最低的平均相似度 (尽管有几个10-q项目在同比变化方面更接近)。
3.报告关键部分可预测性的回测
接下来,我们采用图 6 中列出的项目/部分类别,并检查与每个部分的更改相关的返回可预测性。为此,我们仅使用特定项目的文本部分为10-k的每个项目构造相似性度量。与以前一样,对于四个相似性度量中的每一个,我们都会根据上一年所有股票的相似性得分分布来计算五分位数。表 VII 报告了关键部分具有最大收益可预测性的证据以及相应的日历时间投资组合收益。
表 七 提供了一些有趣的发现。 然而,在面板A和B的不同规范中,结果的一致性存在差异,因此,我们认为这些结果提供了暗示性但不是确定的证据,表明在文件中返回结果最明显的地方。例如,表 VII 表明MD & A部分的变化与重大的未来回报可预测性相关,但是,这种影响的程度 (每月11至22个基点之间) 通常小于与法律诉讼部分 (10-k中的第3项),有关市场风险的定量和定性披露部分 (第7A项) 有关的影响,特别是风险因素部分 (项目1A)。变化集中在风险因素部分,例如,L/S投资组合收益阿尔法 (非兑换商减去兑换商) 每月高达188个基点 (t 2.76),或在表 VII 的面板A中每年经风险调整的异常收益超过22%。这些结果表明,某些部分的变化可能相当微妙,市场难以检测,尽管它们可能对未来的回报有很大的影响。
鉴于萨班斯-奥克斯利法案 (见Li (2010)) 后,风险相关项目报告的潜在结构性突破,我们还重新运行了萨班斯-奥克斯利法案后 (2003 2014年) 风险因素部分的分析。互联网附录中的表 I A.I 显示,在最近的子期间,我们继续发现与风险因素部分的变化相关的大量且显着的回报可预测性。
最后,在图 9 中,我们在条形图中绘制了按文档部分的价值加权投资组合阿尔法。这个数字再次强调了风险因素部分的巨大可预测性。
4.与投资者的关注互动
为了进一步探索我们的机制,我们接下来关注投资者 正在 更加关注这些文件的案例。 在这些情况下,如果我们的回报可预测性结果主要是由投资者的注意力不集中驱动,我们记录的回报效应应该被静音。为了确定投资者注意力的差异,我们利用了一个新的数据库,该数据库可以非常精细地捕获投资者的行为,即SEC EDGAR流量日志下载文件。该数据库包含与下载代理/实体的ip地址匹配的公司文件的所有下载记录 (请参阅Chen等人。(2017),Loughran和McDonald (2017) 了解详情)。与Loughran和McDonald (2017) 一样,我们消除了机器人请求的影响,其中包括大型机构投资者 (通常是量化投资公司) 的大量下载。为了检验这样一个假设,即投资者更 “专注” 的公司看到的回报更微弱可预测性效应,我们对我们的相似性度量以及这些相似性度量与根据SEC日志文件计算的投资者关注度量的相互作用,运行单个公司级别股票收益的Fama-MacBeth横截面回归。具体来说,我们构造变量 ipaccessmultipyear,作为访问同一公司的当前10-k/10-Q和前几年10-k/10-Q的唯一ip地址的数量 (按访问当前10-k/10-Q的唯一ip地址的总数归一化)。这个变量背后的想法是,如果投资者同时下载今年和去年的文件,他们更有可能在文件中找到推动我们回报结果的变化,因此在本年度文件发布后,将这些信息更快地计入价格,导致未来回报可预测性降低。
表 VIII 显示数据中存在这种模式。上的交互项Ipaccessmultipyear相似度 始终为负,并且对于四个相似度度量中的两个在5% 级别上具有重要意义。例如,在表 VIII 的第 (8) 列中,该相互作用项的系数为负且显着 (0.010,t 2.05),意味着检查10-ks/10-Qs变化的唯一ip地址的数量的一个标准差增加与0.0136 (或22%) 的 相似性 的可预测性的降低相关联。我们认为这些结果提供了暗示性的证据,即当投资者对同比公司备案的关注程度较大时,我们在本文中记录的回报可预测性结果会稍弱一些。表 IX 中的 23,我们通过试图查明市场未能纳入定性变化而不是定量信息的确切方式,从而更深入地挖掘了投资者注意力不集中的本质。为此,我们试图将那些在年度和季度申报文件文本中做出比较陈述的公司隔离开来,并将它们与没有比较的公司进行比较。例如,我们将公司包括与去年 (季度) 或相对于去年 (季度) 的短语以及对上一年的引用 (例如,对于2017年度报告,我们隔离了提及,例如比较2016年或相对于前一年的提及); 我们使用的比较短语列表在表 IX 的面板B中提供。该程序表明,样本中约有3分之1包含在其文件中做出明确的比较文本陈述的报告,而3分之2公司则没有。然后,我们将比较样本划分为那些对特定会计变量进行明确文本比较的公司 (例如,“相对于先前年度息税折旧及摊销前利润 “) 和那些没有的。
我们发现,我们的主要回报可预测性结果是由那些 没有 在其申报文件中与先前时期进行明确的文本比较的公司驱动的。这些结果与行为解释一致,即在其文本中明确提请注意以前的年份并积极促进投资者的信息处理的公司不太可能在其报告中发生变化而被市场忽视。实际上,在表 IX 中,我们发现我们的基本收益可预测性投资组合结果来自表 II 集中在那些 不 进行这些明确比较的公司中。
此外,我们发现,对于投资者进行从SEC服务器的多年下载 (请参见Internet附录中的表 IA.VIII)。回想一下,上面,我们表明这些公司的长期可预测性结果较弱,但这些发现的自然含义是,短期公告效应应该更强。因此,虽然我们发现在我们的样本中总体上没有与文件更改相关的公告效应,并且对于那些投资者没有下载多年文件的公司也没有公告效应,对于那些投资者正在进行多年下载的公司,我们发现与文件更改相关的重大短期公告效应。由于这些公司的投资者基础似乎更关注同比的文件变化 (正如我们多年的SEC下载措施所代表的那样),明智的是,与文件变化相关的即时公告效应对这些公司来说将更加明显,随着投资者 (和价格) 对这些变化迅速做出反应。
5.真实效果
为了进一步阐明驱动我们论文核心的回报可预测性结果的因素,我们还研究了文件相似性变化预测相关公司未来经营业绩下降的程度。在表 X 中,我们提供了有关公司对未来营业收入,净收入和销售额的相似性评分的可预测性的证据。所有未来的会计变量都在未来两个季度进行衡量。具体来说,我们定义了以下实际的绩效衡量标准: Oibdpq/L1atq 是折旧前营业收入 (Oidbpq) 除以滞后总资产 (L1atq),Niq/L1atq 是净收入 (Niq) 除以滞后总资产 (L1atq),Saleq/L1atq 是销售额 (Saleq) 除以滞后总资产 (L1atq)。所有这些会计变量都是在1% 层面上进行的,这个表中的回归包括月份、行业和公司固定效应。我们还调整了每月级别的聚类标准误差。
与我们在本文中记录的返回效果的想法一致论文是由实际的“未来”经营业绩下降驱动的,在所讨论的公司,表 X 显示,所有四种相似性度量显著预测了这三种经营业绩的度量 (盈利能力,运营盈利能力和销售)。例如,关注表 X 的第一行中的 Sim Jaccard 度量,我们看到相似性的降低 (即,备案中的更多变化) 是未来营业收入、净收入和销售额降低的重要预测指标。这些发现突显了这样一个事实,即我们在本文中确定的文件中的细微变化与这些公司的绩效发生根本变化有关。
6.该机制的其他种类和测试
我们运行各种其他测试,这些测试在本文的互联网附录中列出。例如,我们对投资组合进行了额外的双重测试,例如针对情绪,不确定性和诉讼,其中 “低” 和 “高” 分别定义为小于和大于中位数。对于每对低样本和高样本,我们计算类似于表 II 的五分位数投资组合。 互联网附录中的表 IA.II 显示,较早记录的返回结果集中在低情绪,高不确定性和高诉讼性子样本中。例如,jaccard相似性度量的L/S五因子alpha在高诉讼性子样本中每月为71个基点 (t 3.29),在高不确定性子样本中每月为72个基点 (t 3.51),或在每年的异常收益方面超过8%。
在互联网附录中的表 IA.IV 中,我们从数据中删除了与特殊事件 (例如,并购,合资企业,资产剥离或战略联盟) 相关的所有年份。这些事件会机械地导致公司10-ks和10-qs的变化,这可能会混淆我们的结果。我们发现,在从样本中删除这些特殊事件后,我们的结果仍然保持强劲且具有统计学意义。
我们还研究了文件更改是否可以预测相关公司的其他类型的更改,例如未来的新闻发布,投资者行为的更改以及这些公司的重要事件。特别是,在互联网附录的表 IA.VII 中,我们报告了公司对公司未来8-K释放,短期利息,收益意外 (SUEs) 和未来破产事件的相似性评分的可预测性。 我们发现暗示性证据表明,同比相似性的下降预示着未来8-k的数量增加,未来空头权益的增加,未来收益的负惊喜以及未来破产数量的增加。总的来说,这些结果表明,文档更改具有一定的能力来预测相关公司的未来 (坏) 消息。
接下来,我们研究文本相似性可能与
公司的生命周期。为了衡量公司的生命周期,我们遵循Spence (1979) 、Kotler (1980) 和Anthony和Ramesh (1992),并使用 (i) 年度股息占收入的百分比,(ii) 销售增长百分比,(iii) 按总资产归一化的资本支出,以及 (iv) 公司年龄。然后,我们对滞后的五年平均折旧率,销售增长,资本支出和年龄进行Jaccard相似性度量的回归。回归在整个样本1994年2014年上运行。结果报告在互联网附录的表 IA.XI 中。我们发现折旧率和公司年龄与Jaccard相似性负相关,而销售增长和资本支出与Jaccard相似性正相关。这些结果表明,随着财务披露的成熟,公司越来越多地修改其财务披露。
7.附加稳健性检测
在我们的最后一组分析中,我们首先执行稳健性检查,以确保我们的关键发现不是简单地重新包装一组先前已知的返回预测器。为此,我们在包含额外的公司层面特征 (如应计项目 (以确保应计项目异常 (见斯隆 (1996)) 不会推动我们的发现) 、投资、毛盈利能力和自由现金流) 后,重新运行表 IV 中的Fama-MacBeth回归。表 XI 表明,这些变量中没有一个会导致与公司报告实践的变化相关的回报可预测性 (由我们的相似性得分捕获)。接下来,我们直接检查行业集中度对我们记录的结果的影响。特别是,我们测试我们记录的结果是否集中在任何特定的行业 (或行业)。例如,如果所有 “改变者” 都来自某个行业,而 “非改变者” 则来自另一个行业,我们将只是渴望并做空不同的行业。为了解决这种可能性,我们运行了表 II 的日历时间投资组合的行业调整版本。具体来说,对于每个行业,我们根据文档的变化将 该行业 分类为Q1至Q5。然后,我们将每个行业的Q1至Q5投资组合汇总到整个市场的Q1至Q5,现在等效地按建筑代表每个行业。互联网附录中的表 I A.V 显示,在进行行业调整后,结果仍然强劲而显着,这表明我们发现的主要结果与特定行业无关。
最后,在互联网附录中的表 IA.XIV 中,我们确认我们的结果不受包括所谓的停止词 (请参阅Loughran和McDonald (2011)) 或我们对SEC文件的特定过滤的影响。 我们删除停止词,并使用Loughran和McDonald (2011) 提供的清理的10-k/10-Q公开可用数据库,我们发现我们的主要投资组合结果比表 II 中报告的结果更大,更重要。
综上所述,我们的结果表明,公司报告行为的细微变化对未来回报具有实质性的可预测性,这种方式以前没有在文献中记录过。
结论在本文中,我们表明发现公司向市场提供的最全面的年度信息发布,即他们的强制性年度报告会随着时间的推移发生了巨大变化。特别是这些报告变得越来越长,越来越复杂。尽管过去的文献发现与这些声明相关的公告效应一直在下降,因此得出:随着时间的推移,它们的信息变得越来越少,我们的证据指向一个不同的结论。我们发现,报告中简单的更改之处是衡量未来公司绩效有力的指标。具体来说,当公司在年度和季度报告中脱离常规措辞和内容时,这种变化是有关公司未来成果的重要信息内容。
然而,投资者对这些简单变化中有价值的信息并不关注。在年度和季度财务报告中,卖空 “改变者” 并购买 “未变者” 的投资组合在第二年可每月赚取30至50个基点。回报会持续18个月,并且不会反转,这表明这些回报变动不是过度反应,而是反映了真实的、根本的变化,只有在报告变化后的12到18个月内,公司才逐渐被纳入资产价格。重要的是,这些回报模式适用于整个公开交易的公司 (因为上市公司必须提交年度报告) 、大公司以及廉价的做空公司,而且因为它们发生在几个月内,所以不太可能被套利的限制所驱使。此外,与其他传统的漂移规律 (例如,回报动量,行业动量,收益公告漂移 (PEAD)) 不同,这些数据不会伴随重大收益公告而改变,因此与标准的反应不足不一致 (因为没有初始反应)。相反,它们与投资者一样,对丰富的信息不关注,因此,这些信息只是在很大程度上延缓了价格反应。事实上,当我们衡量投资者在 “比较” 今年与往年的申请倾向,从而明确克服我们在本文中提出的懒惰/注意力不集中机制时,我们发现回报显著降低。
技术进步降低了信息生产和传播的成本,使Grossman-Stiglitz投资者的工作变得更加复杂。尽管技术也可以帮助收集和处理这些信息,但我们发现,一年接一年文档的简单更改包含了有价值的信息,而这些信息似乎被资本市场忽略了。这种观点可能更广泛地适用于其他形式的公司信息。有规律、被反复使用的文件如债券契约、租赁协议、证券发售文件、并购招股书等,可能需要进一步研究丰富。然而,更广泛地说,研究公司中重复突发行为的意义,为公司融资和资产定价开辟了一个关键但尚未得到充分研究的领域。
参考文献
翻译感悟
这篇文章大概翻译了一个周的时间,文章想要表达的想法比较好理解,但是具体到一些话语上有很多需要进一步理解的翻译,很多英文单词需要从意思的角度出发来对应成中文,在翻译过程中不断学习英文和中文的意思表达。
这篇文章讲“Lazy Prices”,如何定义“Lazy”呢?懒价格的懒在我看来是一种时间上的滞后性。即公司在年报内容的改变上或多或少的暗示了股价将要波动的趋势,而市场中的投资者却忽略了这种变动,等到某一时刻,某个条件作为触发是,价格才照着报表中暗示的方向猛然波动。
文章引用了百特公司的例子作为引入,我们可以生动的发现由纽约时报爆出的公司巨大经营性变动其实早已经在报表中有所体现,如果说能够及时地对这一变化进行洞察分析,及时做空的话,其收益率是极其可观的。由此,作者也对市场中的参与者表示了某种程度上的不满,认为如此可以预先几个月发现市场波动的机会被白白的浪费了。
后文作者通过四种自然语言对报告所发生的变动(相似性)进行了度量,相应的可以通过相似度越高则报告更改的越少来判断是否属于“改变者”。同时作者还通过摘取了某些关键词语,通过这些关键词语的数量变化来与未来公司的价格变化相联系。在具体的 *** 作过程中,作者利用Fama-MacBeth回归,采用FF三因子作为控制变量测度时得到了22%的超额年化收益率。
另外,作者在具体的实施方案上也别出心裁,他们选取了下载报表的时间戳等相关的数据巧妙地描绘出了下载报告的人对报告的关注程度,我认为这一点的分析很具说服力。
欢迎分享,转载请注明来源:内存溢出
评论列表(0条)