返回

全文翻译

互联网公司是否应该为用户当前免费提供的数据付费?


       不论你知不知道,你都身兼着数职。大多数人的工作从一大早就开始了:因当你拿起手机,便开始生产数据,这些数据组成了硅谷最重要的资源。根据一篇引人入胜的新经济学论文的说法,我们至少应该按照这种方式来思考数据创造在经济中所扮演的角色。如果未来经济要良好运作,并避免因新技术产生而造成的失业危机,我们就必须考虑到这一点,并据此改变大型互联网公司与其用户之间的关系。

       论文的作者们说,人工智能一直在不断进步,并且随时将改变一大批产业的形态。但是,为了学习驾驶汽车或识别出人脸,让聪明的机器运转起来的算法通常必须需要通过大量的数据进行训练。每当用户点击谷歌搜索结果时,或者向亚马逊的Alexa发出指令时,互联网公司都会从用户那里收集这些数据。它们还通过验证码这样的工具来从用户那里攫取有价值的数据,这些工具要求访问者解决对人类很容易但对人工智能很难的问题,比如破译机器无法分析出的书中文本。人们通过为企业提供它们渴望的数据,来为有用的免费服务“买单”。

       这些数据成为企业资本的一部分,严格意义上来说,也是竞争优势的可怕来源。未来的创业公司本有机会对互联网巨头提出挑战,但如果它们访问不到被巨头独占的数据,就无法训练自己的人工智能。它们最大的希望往往恰恰是被那些巨头收购,而这又让缺乏竞争力的市场再添问题。作者认为,目前人工智能对生产率增长的贡献很小,部分原因是免费数据的模式限制了所收集到的数据的质量。试图为人工智能研发有用的应用程序的公司肯定希望自己拥有足够多的数据,或想出方法来诱导用户无偿为其提供更好的信息。

       为了解决这 些问题,他们提出了一个激进的提议,数据应被视为劳动力,而不是被看作成资本——更确切地说,被当作生产此类信息的人的财产,除非他们同意将其提供给企业以换取报酬。在这样的世界中,用户数据可以多次出售给多家公司,从而降低数据集在市场准入门槛中的重要性。向用户数据支付费用将有助于分散人工智能产生的财富。公司也可能通过付款来获取质量更好的数据。

       作者的想法还需要进一步的充实。他们的论文虽然发人深省,却只有五页纸长。部分设想的方案似乎不切实际。人们是否能在没有大笔金钱的诱惑下,有兴趣花时间描述自已一上午都干些啥或是在办公室的习惯呢? (而他们的数据又是否足够有价值,让企业愿意支付大笔费用?)这样的系统难道不会吸引数据雇佣军,用大量无用的垃圾数据狂轰滥炸,只是为了快速捞上一笔?

除了大脑,别无可用

       尽管如此,这篇论文中还是包含了一些至关重要的见解,可以为讨论有关数据在经济中的作用提供框架。一个是数据市场的权力不平衡。其中部分原因是大型互联网公司的集中。但另一个原因是,尽管数据可能在总体上非常有价值,但一个人的个人数据通常并非如此。因此,与互联网公司进行有效谈判可能需要集体行动,也许还需要形成“数据工会”。这可能也有弊端。工会可能免费提供所有用户的数据,但要求分割公司的部分利润作为报酬。这将排除作者认为对于提高数据质量至关重要的付费数据工作模式。

       最重要的是, 作者的建议将人工智能的世界中价值的集体属性摆在了舞台中央。每个人都变得像一口油井,喷涌出数字经济赖以运行的燃料。无论是出于公平还是效率的需要,都要求这种燃料所产 生的收入应根据我们每个人的贡献更加均等地分配。棘手的是要搞清楚该如何实施。

备注:来源《阅读同源外刊时文精析》