您现在的位置:首页 > 国际资讯 > 正文

尚道编译第50期|人工智能可以模拟经济选择吗?

更新时间:2020-09-10 14:21:48  |  来源: 尚道战略

来自哈佛大学和Salesforce的研究人员开发了一套人工智能系统,旨在提出新的税收政策,他们称之为“人工智能经济学家(AI economist)”。大多数现行的税收政策模型都是基于先前的研究结果来推断人们对政策变化的反应。然而,在AI经济学家的方法中,计算经济参与者的行为从一个简化的游戏经济中进行学习。他们使用了一种叫做“强化学习(reinforcement learning)”的人工智能。
 

强化学习
 

人工智能的一个特定子领域,称为强化学习,其一直在推动复杂行为建模方面的进步。强化学习系统在电子游戏中击败了人类玩家,并使机器人动作变得不可捉摸。强化学习通过对可能的行为进行随机探索,然后鼓励那些导致积极结果的行为来发挥作用。在一个简单的乒乓(一种虚拟的乒乓球)游戏中,探索过程需要左右移动球拍,每次程序成功回球都有奖励。然后人工智能学会选择在类似的过去情况下导致首选结果的行动。随着时间的推移,随机性让位于意向性,而人工智能将有能力回击每一次击拍。人类的思维过程可能会让位于这种令人惊讶的策略。例如,在开放人工智能的捉迷藏系统中,人工智能代理人学会了操纵游戏机制,超出了人类设计者的预期。
 

“人工智能经济学家”的方法

——从博弈到博弈理论

 

哈佛和salesforce的研究人员将这种方法从游戏应用到博弈论中,建立了一个简化的世界,在这个世界中,人工智能可以收集资源(石头和木头),然后通过建造房屋或在他们之间销售商品来赚钱。人工智能的技能水平不同,这就产生了激励专业化和创造经济不平等的双重结果。他们没有对这些行为主体的行为进行硬编码,而是将最佳结果定义为金钱和闲暇时间的混合,然后让参与者了解什么选择能让他们获得最好的结果。就像捉迷藏一样,强化学习产生了我们在人类身上看到的各种微妙的活动——在这种情况下,是经济活动,比如避税策略。这种行为的复杂性是耐人寻味的,因为它可能提供了一种在复杂模型中产生更现实的经济行为者的方法。
 

该系统还创建了人工智能政策监管机构,调整边际税率,试图最大化经济效率和公平。相关论文将这一观点视为一项重大贡献(题为《人工智能经济学家》),而且这是一项有趣的提议。当然,这并非是一个全新的概念,强化学习以制定模拟经济的政策的想法早在2004年就提出了。此外,已经存在一些方法来评估许多不同的税收制度,其复杂性远远超过仅仅为收入等级设定边际税率。
 

相反,值得进一步考虑的是经济中的人工智能角色。深度学习和强化学习都取得了巨大进步,2016年AlphaGo击败世界围棋冠军李世石(Lee Sedol)就是最好的例证。将现代强化学习方法应用到模拟经济中确实很有吸引力。然而,这种新方法带来了挑战。为了理解强化学习方法对学习行为的潜在价值,理解现有的税收模型是如何工作的。


 

现代税收模型中的行为
 

在过去的四年里,这些模型被用来评估来自总统竞选的主要税收提案。虽然这些模型可以模拟各种各样的收入和工资税政策,但它们在核算个人行为变化方面更为有限。它们主要基于纳税申报单中的行政数据,而这些数据并不能洞察纳税人对税收政策的反应。行政税收数据可以告诉你大多数美国人赚了多少钱。然而,仅凭这些数据并不能告诉我们这些信贷是如何影响工作决策。
 

为了做到这一点,模型使用了运用实证研究的方法评估个人对税收反应。例如,TPC模型假设,随着边际税率的上升,报告的收入将小幅下降,而高收入者的行为将发生较大变化。TPC模型还考虑了其他重要行为,比如税收对资本利得实现的影响,以及在标准扣除额和分项扣除额之间的选择。不过,与个人应对税收的方式相比,行为影响的清单还是很短的。所有模型都是如此,包括联邦政府使用的模型(例如,税收联合委员会和国会预算办公室)。
 

政策的小调整会导致小的行为影响,所以模型的变化比较准确,接近基准政策。然而,随着变化变得更加剧烈,行为影响可能会变得更大,因此,评估模型估计的准确性就会变得更加困难。


 

学习微观经济行为的两个挑战

 

对微观经济行为的有限核算是当前税收政策微观模拟模型的一个已知的和显著的弱点。因此,“人工智能经济学家”的论文提出了一种潜在的方法来模拟经济行为者的复杂行为是很有吸引力的。在实现这一承诺之前,有两个巨大的障碍:创建一个现实的虚拟经济,以及在人工智能代理中产生类似人类的行为。
 

1、建立一个现实的虚拟经济
 

为了产生有意义的行为,游戏化的经济必须更加现实。在简化版中,人工智能收集石头和木头来建造房屋,还不够复杂,不足以创造出有意义的现实行为(这不是对论文的批评,这是一个令人信服的概念证明)。就连作者们似乎也意识到,简化后的经济环境所产生的税率——就像骆驼的驼峰一样——还不够引人注目。建立一个足够真实的经济模拟将需要大量的时间。需要有更复杂的市场代表,包括就业、住房、教育、金融、儿童和老人照顾、政府等等。从历史上看,经济学家一直不愿在大规模的经济模拟中投入太多资金。我们也做了一些努力,比如上世纪90年代末在桑迪亚国家实验室(Sandia National Laboratories)建造的美国经济模拟模型阿斯彭(ASPEN)。然而,面向公众的模型似乎并没有得到足够的支持来继续开发。
 

经济数据收集的急剧增加,特别是在数字经济中,可能有助于实现这一目标。然而,这些数据中的大部分是无法公开的。如果研究人员能够将来自谷歌、领英、亚马逊等数字巨头的大量专有数据集以及信用卡交易数据结合起来,就会呈现出一幅更加全面的经济图景。当然,将这么多数据整合到一个地方显然会对隐私造成危害。虽然构建一个足够复杂的经济模拟系统以产生可信的行为是困难的,而且需要耗费大量资源,但对视频游戏的研究表明,这是可能的。从2002年爱德华·卡斯特罗诺娃(Edward Castronova)对Everquest的分析开始,经济学家们就注意到,电子游戏市场的现实程度足以导致外包、稀缺、通胀和套利。它们的影响甚至可以波及到现实世界,比如陷入困境的委内瑞拉人生产虚拟黄金,然后以实际国际货币的形式出售。人工智能主体的经济行为只有在经济模拟是准确的情况下才能提供足够的信息。然而,即使是一个超精确的虚拟环境也不一定会产生真实的人工智能代理。
 

2、限制人工智能的现实人类行为
 

AlphaGo的强化学习系统定期检查50到100个走向未来的选项——虽然不是完全详尽,但肯定超出了人类的能力。这是现代人工智能不懈努力的代表。就人工智能经济参与者而言,这可能有助于发现提议的税收计划中的漏洞和潜在的避税(甚至逃税)策略。它也是高度个性化的,这意味着行为是专门从行动者的情况中学习的,比如他们的技能和经济前景。另一方面,这也意味着人工智能参与者在优化其经济状况时需要受到约束。这并不是说人工智能不会享受闲暇,因为研究人员对“最佳”的定义是放松和赚钱的混合。然而,这确实意味着人工智能超乎寻常地理性,以人类无法做到的方式最大化他们的资金和休闲。
 

几乎在所有社会公益应用程序中,人工智能都是单打独斗。通过领域专家的谨慎应用,人工智能可以带来渐进式的改进,随着时间的推移,这些改进会产生有意义的影响——政策研究亦是如此。我们可以合理地假设,任何经济行为模型的强化学习都需要很长一段时间才能得到有效的应用。这一点尤其正确,因为它需要更全面的经济模拟才能提供真正的信息。许多因素表明,这可能是由于计算能力和大数据的可用性不断提高,行为经济学的普遍接受,以及从理论模型转向实证经济学的更广泛的转变。如果它真的流行起来,可能会出现一种从根本上提供更多信息的经济分析方法,这种方法可能有助于设计一个更好的税收体系,甚至可以告诉我们税收政策方面的漏洞。

 

相关搜索:人工智能经济学