喻予
社交媒体用户生成的内容在量化分析情绪和幸福方面的价值正在诸多方面显示出来。而搜索引擎也可以提供跟踪有关健康和幸福的信息,Google凭借其独特的利用Google趋势工具公开提供的搜索查询数据,提供了适当和强大的数据基础。与问卷调查相反,通过社交媒体与搜索引擎的分析可以实时地分析和预测幸福感,包括反映由于突发事件的发生而产生的幸福感的波动效应。
幸福是一项基本的社会指标,很长时间以来,它在社会科学文献中引起了越来越多的关注。特别是,幸福感研究正在积累越来越多的证据来支持实证研究其决定因素的结果。通常,幸福感是通过自我报告的问卷答案来衡量的。而现在,已经有研究开始重点关注在人气颇高的微博网站上发布的不请自来的消息。
近年来,社交网络呈指数增长,而网络的使用日益提供了收集信息的机会,这些信息可以通过统计分析,进行关于……的研究。与问卷调查相反,分析社交媒体可以实时地预测幸福感,包括反映由于突发事件的发生而产生的幸福感的波动效应。
关于幸福的研究至少可以追溯到社会科学领域的杰里米·边沁和他的“效用论”,最大幸福原则,可以定义为快乐多于痛苦 (Bentham,1789)。“幸福”这个谜题与它的测量有关。
埃奇沃思(Edgeworth,1881)设想了一种可能性,那就是建立一种享乐计,能够测量一个人在她生命中的每一个瞬间的效用,以便计算效用随时间的积分。经济理论,处理人与人之间的比较问题,考虑到(在当时)建造这样一台机器在技术上是不可能的,更倾向于帕累斯泰方法——the Paretian approach of ordinalism。因此,个人的福利传统上是从消费者的选择中推断出来的,并通过收入等货币指标来衡量。
幸福概念的重新出现及其与效用的非线性关系,主要归功于伊斯特林(Easterlin)在上世纪70年代的开创性著作,他从宏观经济角度利用国家数据,发现一旦达到临界门槛,幸福与收入之间没有关联。
而关于效用的直接测量,卡尼曼等学者(1997)展示了经验效用概念的实验证据。在他们的框架中,经验效用是事件对人们福利的实时影响,它不同于决策效用,而决策效用是对事件本身的事前评估。在这方面的问题是,代理人往往重视一个经验的效用,试图记住一个类似的情况:他们在过去生活的享乐主义内容。这种回顾性分析是偏颇的,因为人类的认知局限,会导致错误的判断。卡尼曼等学者的结论与社会科学理论特別相关,因为它破坏了揭示偏好方法的效力,同时导致了对效用的整个概念及其与幸福的联系的重新思考。
过去几年的技术进步使人们有可能制定衡量幸福程度的措施。这些方法可以替代传统调查;在某些情况下甚至比传统调查更为复杂;此外,这些措施还具有很大的优势,可以实时捕捉体验的享乐效果,同时提出对效用的持续测量方法。在这方面提出了两种方法:一种是经验抽样模型(ESM)方法,另一种是日常重建方法(DRM)。
ESM和DRM在深入了解幸福的决定因素方面都很有吸引力,但与它们的使用相关的一些问题仍然存在。例如,对于大样本来说,它们似乎是不切实际的,而高的无响应率可能会扭曲结果的可靠性。此外,它们对那些被要求在系统基础上应对外部冲击的应答者造成了特别沉重的负担。
意大利埃尼企业的三位学者研究了意大利社交媒体用户在社交网络服务推特(Twitter)上发布的信息,以调查幸福带来的特殊冲击。与问卷调查相反,分析社交媒体可以实时地预测幸福感,包括映射由于即时事实的发生而产生的幸福感的效应。他们的数据集包括每天在110个意大利省份发布的4300万条推特信息。在衡量幸福感的过程中,他们使用创新的统计技术构建了一个原始的指数,来量化省一级的与推文特定数量相关的幸福水平。然后,在样本中探索幸福的决定因素。静态变量,如机构的总体质量,似乎对意大利各省的平均幸福水平影响不大。相反,影响最大的是与特定日期相关的气象变量和事件,比如德国和意大利债券之间的价差变异性或发薪日。
他们的相关论文参考了经验效用的文献,并尝试用一种完全不同的方法来评估人们的实时幸福。不涉及问卷调查,相反,则利用互联网用户每天免费发布的信息,特别是社交媒体上的信息。文献越来越多地利用网络上的现有信息,对广泛的主题进行实时预测,包括宏观经济事件、股票价格、政治偏好。
关于幸福,Dodds等学者分析了Twitter在美国的案例。他们使用了亚马逊(Amazon)提供的一种设备,名为“机械土耳其人”(Machical Turk),这是一个付费网站,志愿者们可以在网站上对一万字英语的快乐程度进行评分。然后,这样得到的平均分数被用来编纂新的推文(到目前为止,来自全世界的超过6000万条推文已经被分析过了)。而学者kramer专注于一个样本用户在脸书(Facebook)上状态更新的内容,通过计算一个预先编撰的本体论词典中被判断为“积极”和“消极”的单词所占的百分比,开发了一个幸福度指标。Quercia等学者展示了如何利用社交媒体(特别是Twitter)来确定整个社区的幸福程度(在他们的例子中是伦敦市区)。
当前,社交媒体已成为公众讨论的热门话题,在过去几年里,它在学术界和业界的吸引力稳步上升。社交媒体包括很多著名的网站,在那里人们分享他们的想法、图片或视频,以及互联网社区,例如: Facebook、Twitter、Google、Youtube。相关数据表明,今天几乎所有的互联网用户都参与了社交媒体。
在实际中,用户生成的内容在业务预测方面的价值已在诸多方面显示出来。例如,在线消费者评论可以用来预测电影的成功、电子游戏销售、音乐销售或图书销售。
德国学者Nofer和Hinz表示,在探索用户所生成内容对股票收益之影响这方面,实际中已经有了诸多研究成果。一般来说,人们可以区分对感兴趣的特定事物的情绪检测与情绪水平的分析,即积极或消极情绪状态的强度。例如,既有的方法侧重于通过分析消费者评论或股票留言板的内容,来衡量公司的情绪。
在这方面,是薄伦(Bollen)等相关专家学者进行了开创性的研究,其结果表明:从公众推文(tweets)中提取的情绪水平对道琼斯工业平均指数具有预测价值。在整体情绪平静的时候(或者在某种程度上是快乐的),从统计学的角度,可以发现DJIA在几天后有相关反应的显著迹象。
其他一些使用Twitter预测股市的研究也出现在最近几年。例如:有研究人员将Twitter的人气与谷歌的搜索量结合在一起,预测了大宗商品(如石油、黄金)和股票的回报率、交易量和波动性;有研究人员在stocktwits.com上研究了3个月的大约7万个帖子,也揭示了微博信息对股票市场发展的预测价值。
相关学者Nann等曾在欧洲信息系统会议的讨论中,基于Twitter、在线消息板和公司新闻的用户发帖,创建了一个交易模型,在考虑交易成本后,该交易模型的表现优于标准普尔500指数0.24%。而Sprenger等学者专注于被标记的tweets(例如,微软的MSFT),并发现Twitter的人气与回报之间具有系数r = 0.166的相关性。
不只Twitter,其他社交网络也受到了考查。有学者研究了从LiveJournal上提取的情绪,显示标准普尔500指数在焦虑水平上升的情況下下降。在最近的一项研究中,学者Karabulut发现Facebook的国民幸福总值 (GNH) 可以预测美国股市的回报。
毫无疑问,线下和网络世界的研究提供了证据,表明股票市场是由市场参与者的情绪状态驱动的。行为金融和神经金融方面的研究人员试图解释投资者情绪与他们的交易行为之间的联系。例如,个人倾向于厌恶损失,这意味着他们更重视损失而不是收益。
虽然早期的研究通常是在实验环境中进行的,但社交媒体应用程序现在可以帮助揭示社交情绪。心情好的人更愿意投资高风险资产,比如股票。因此,股票回报取决于投资者的风险偏好,而风险偏好又取决于投资者的情绪状态,而大众情绪状态在社交媒体上往往有所体现。
总之,情绪和情绪对股市的影响是可以通过Twitter、Facebook或LiveJournal来衡量的。基于情绪状态的股票收益预测可以看作是与有效市场假说相矛盾的市场异常现象。
随着因特网用户数量的增加和搜索引擎使用量的增加,利用搜索引擎提供的网络搜索查询数据这种收集市场数据的新方法变得越来越流行。人们通过搜索产品说明,选择各种替代品,以及他们指定的要购买的东西,创造出一条线索,向搜索引擎揭示他们打算购买的东西。搜索引擎提供商可以跟踪这些信息,Google凭借其独特的利用Google趋势工具公开提供的搜索查询数据,提供了适当和强大的数据基础。
越来越多的学术研究以Google搜索查询数据为研究目的,深入于各个经济部门,像房地产研究领域。基于用户对特定感兴趣领域信息的需求得到了很好的满足,Google作为情绪指标的潜力被充分揭示了。这有助于研究人员对不久的将来作出推断。
在越来越多的针对不同经济部门的研究,尤其是房地产研究领域的研究成果的支撑下,谷歌的数据有可能同时考虑到消费者情绪的变化,从而能够对现实世界近期的未来做出推断。
这一优势可以很容易地用于销售力度(例如房地产机构)的分配和时间安排。这一系列研究也为及时提供政策建议提供了一个有价值的指标,因为政策建议在其他方面取决于数据,而这些数据在报告之前往往会出现时滞。这是Google数据的主要优势,因为社会经济信息只能在很长的时间内才能获得,而且由于样本较少,调查可能会有偏差。
Google搜索量数据克服了许多这样的问题。谷歌通过其工具“谷歌趋势2.0”(Google Trends 2.0)提供可公开访问的搜索查询数据,该工具是从“Google Insight for Search”发展而来的。与其他情感数据集不同的是,时间延迟几乎可以被忽略,因为Google的数据在收集的两天后便可获得。此外,与基于调查的指标相比,数据收集所需的努力要少得多。还有,样本量比较大,避免了上述问卷偏差等问题。
自从互联网的出现,“知识的民主化”的积极和消极的后果,可以在生活的各个方面被感受到。与以前相比,现在的病人更多的是向医生提出可能的诊断,而不是描述他们的症状。根据皮尤互联网与美国生活项目(Internet & American Life Project)的数据,80%的互联网用户曾在网上搜索过健康信息,这使其在美国互联网用户中成为一种广泛的活动。有关学者预计,在德国和其他互联网普及率足够高的地区也会出现类似的数字。因此,对谷歌搜索“症状”和“副作用”的分析就可以是基于普遍存在和可被采纳的,因此对于可能的选择效应应该没有什么偏见。
在Google中输入“症状”作为查询的第一个单词,会返回几个已完成的被选项,如“Mono症状”“糖尿病症状”“怀孕症状”等。另一方面,通过键入“抑郁”,可以将“抑郁症状”作为完成选项之一。“怀孕”“焦虑”“心脏病发作”等也是如此。所以Google允许我们在与症状相关的搜索上有一个潜入峰值。
为什么一个互联网用户会搜索疾病的症状是有很多原因的。很多时候,这可能是一种自我诊断的尝试,或者是为了他们所关心的人而这样做。人们搜索(而不是去看医生)的原因可能仅仅是因为他们可以利用现有的知识储备,这样他们就可以做很多事情,比如更好地利用随后去看医生的机会,了解其他同样情况的患者的经历,诊断自己感到尴尬的不适,甚至是因为他们是一名疑病症患者或药物迷。在美国,“电子病人”和“参与式医学”是众所周知的。因此,捕捉这个搜索活动的总体总量或会在很多方面都会让人感到不舒服。
相关研究显示了全球金融危机爆发前后,美国和德国的症状搜索强度。症状搜索强度的增长在美国开始得早得多,实际上是在2008年9月金融危机爆发后不久开始的。在德国,金融危机没有立即产生明显的影响,症状搜索强度在2009年4月之后不久出现了激增,此时,金融危机演变成了一场经济危机(失业率较温和上升的最高点,但也是失业救济的最高点)。两国症状搜索强度都在2010年4月达到顶峰。
相关专家认为,这清楚地显示,危机导致搜索症状激增。不过,这是否意味着所谓的参与式医学的兴起,或者是“病因”和“不适”的上升,目前还不清楚,这将需要进一步的讨论。
10月24日,胡润研究院发布《2018胡润80后富豪榜》,这是胡润研究院连续第三次发布此榜单,内容包括《胡润80后白手起家50强》和《胡润80后财富继承富豪榜》两个部分,财富计算的截止日期为2018年8月15日。132位80后企业家财富达到超过20亿元,比去年多33位。其中白手起家的比例为38%,与去年基本一致。
拼多多黄峥首次上榜,以950亿元财富成为80后白手起家新首富。今日头条和抖音创始人35岁的张一鸣财富增长一倍多,以650亿元上升一位至第二。大疆38岁的汪滔财富增长25%,以450亿元位列第三。去年榜首,“教育大王”好未来的张邦鑫财富缩水10%至360亿元,排名降至第四。
50位80后创业者财富超过20亿元,比去年多13位,主要来自在线游戏、区块链、先进制造业、互联网服务、教育和娱乐行业。新上榜17位80后创业者,来自区块链行业最多,有7位。比特大陆32岁的吴忌寒以165亿元财富成为85后白手起家新首富,其次是OKCoin的徐明星、世紀华通的邵恒和饿了么的张旭豪。
今年85后创业者比去年多6位上榜,共有12位,包括2名90后;区块链行业产生最多85后创业者,有4人。比特大陆26岁的葛越晟以34亿元财富成为90后新首富,榜单上还有一位90后是ofo 27岁的戴威,财富30亿元。哔哩哔哩29岁的徐逸以23亿元财富进入80后白手起家50强。
北京是80后创业者居住地的绝对首选,有20人,比去年多6人。其次是上海,再次是广州、深圳和杭州。78%拥有高等学历,来自清华大学、北京大学和浙江大学的各以5位并列第一。
胡润百富董事长兼首席调研员胡润表示:“这些白手起家的80后所创造的企业规模比很多人想象的要大得多。我们百富榜上的企业家们都有一个榜样作用,可以吸引很多新人创业,这些具有开创性思想和领导力的80后成功创业者,对年轻一代的影响巨大,因为他们基本上覆盖的都是新经济,是这个时代的代表。”