Trustpilot成立于2007年,是一个汇总用户对公司和网站的评论的网站。该公司在其网站上拥有2.38亿条评论,对50个国家的近100万个网站进行了评论。
尽管Trustpilot提供对美国企业的评论,但我寻找的几家当地商店并没有被列出。我在Yelp上的运气要好一些。Trustpilot在欧洲的影响力似乎要大得多。
对于本文的目的而言,所分析的公司的优势位于何处并不重要。本文关注的是评论网站上一个危险的地方性问题:虚假评论。
仅在2023年,Trustpilot就在其网站上发现了330万条虚假评论。这是在前一年裁员260万人之后。更糟糕的是,根据发表在《美国国家科学院院刊》(PNAS)上的研究,只有大约一半的消费者能够区分人工智能撰写的文本和真人撰写的文本。
生成式人工智能的兴起给消费者和Trustpilot这样的公司带来了一个日益严重的问题:过滤虚假评论,识别真实消费者的真实意见。
Trustpilot将这一挑战作为公司的一项重要使命。ZDNET采访了Trustpilot的首席信任官Anoop Joshi,以了解该公司如何打击人工智能生成的虚假评论。这是一个非常有趣的挑战。
有了这些,我们开始吧。
ZDNET:您能分享一下您成为Trustpilot首席信托官的经历吗?
Anoop Joshi:作为Trustpilot的首席信托官,我和一个大约80人的团队一起监督我们的信托和安全以及法律和隐私业务,涵盖诉讼、公共事务、全球通信、商业合同、内容审核、品牌保护和欺诈调查等广泛的活动。
我四年前加入Trustpilot。我最初负责公司的执法相关工作,即针对企业或消费者在Trustpilot平台上的滥用行为采取的行动。这包括监督和支持我们处理虚假评论和调查各种形式的滥用和误用的行动。诉讼也是这一角色的一部分,特别是与平台上发布的内容以及试图在平台上删除或隐藏评论的企业提交的索赔有关。
这个团队发展成为公司的第一个平台完整性团队,并更多地参与到信任和安全的运营方面,从而使我们在行业层面上所做的工作更加突出。随着Trustpilot与亚马逊、TripAdvisor、Glassdoor、Booking.com、Expedia等公司一起成为可信评论联盟的创始成员,我们的影响力得到了认可,目标是进一步提高在线评论的信任度。
我有律师和软件工程师的背景,今天,这种混合背景支持了我在Trustpilot担任首席信托官的角色。至关重要的是,我们正处于一个法律和技术以多种不同方式交叉的地方,在建立和赢得信任方面,Trustpilot尤其如此。
ZDNET:在当今的数字环境中,您如何定义首席信托官的角色?
AJ:在Trustpilot,我们的愿景是成为信任的普遍象征,这个角色是为了确保我们履行这一承诺。作为首席信托官,我有责任在Trustpilot建立信任的含义。其中很大一部分是我们的评论,我们网站上的内容,以及我们对待客户的方式,包括消费者和企业。
它还涉及推动治理和流程,以降低风险,实现合规性,并最终赢得利益相关者的信任和忠诚,这些利益相关者包括消费者、员工、使用Trustpilot的企业、投资者、政策制定者、记者等。
随着技术在世界各地的组织工作中变得越来越普遍,越来越多的参与发生在网上,信任的问题将继续浮出水面,我预计我们将开始看到对高管层这类角色的更多需求。
ZDNET:你在Trustpilot上遇到的最常见的虚假评论是什么?
AJ:我们将虚假评论定义为那些并非基于真实体验的评论,或者试图以某种方式误导读者的评论。我们经常遇到并删除的类型有:
垃圾评论:人们留下的评论实际上是某种形式的广告,或者伪装成其他业务的推广
利益冲突审查:企业的所有者或雇员审查该企业本身
为了误导而留下的评论:有人提交了一篇评论他们对这个行业一点经验都没有
基于激励的审查:审查本身的性质是误导性的,提交审查的动机是邪恶的
ZDNET:人工智能产生的公司的兴起如何内容影响了o的真实性在线评论?
AJ:这个领域的生成式AI降低了个人创造内容的成本。作为一个平台,Trustpilot设计了自己的自动化系统和引擎,通过关注行为来检测虚假评论。
我们的引擎通过检查提交评论的用户之间的关系并寻找模式或可疑标记来查看评论是如何进入Trustpilot的。虽然评论的内容绝对是我们关注的一部分,但在检测虚假评论时,这只是整体情况的一小部分。
我们的系统一直在关注导致提交评论的行为,我们在最新的透明度报告中的发现显示,在检测到的虚假评论的数量和数量方面,每年都保持相对一致。
这表明,自从推出ChatGPT等人工智能技术以来,我们并没有看到虚假评论的数量激增,而且作为一家公司,我们的发现保持一致。
ZDNET:你能解释一下Trustpilot的人工智能和机器学习系统是如何检测虚假评论的吗?
AJ:提交给Trustpilot的每条评论都会被自动虚假评论检测引擎分析。这些引擎会查看评论的不同功能或方面,如先前的用户行为(该用户向平台提交的其他评论),甚至是促销声明,以检测可疑活动。检测到的一些模式不是立即的,在我们采取行动之前可能需要时间来发展。
除了我们的检测引擎,我们还依赖于Trustpilot社区的消费者和企业,他们可以标记任何他们认为可疑或违反我们指导方针的评论。这些会被标记给我们的人工版主(我们的“内容完整性团队”),他们会评估审查并决定采取的措施。
每当我们删除审查时,我们都会直接联系审稿人,让他们知道原因,并给他们一个挑战决定的机会。
我们的检测引擎和我们的内容完整性团队携手合作,不断改进我们检测和删除虚假评论的方法。
ZDNET: Trustpilot在区分真假评论方面面临哪些挑战?
AJ:我们面临的最大挑战之一是,一些行为模式不会立即显现出来,需要时间来发展和理解这实际上是一种虚假或误导性的评论。在区分真实或虚假评论时,这总是一个挑战。
ZDNET:你是如何处理保留真实评论的问题的用户是否合法地使用人工智能来帮助编写它们?
AJ:我们会考察评论者是否对某家企业有真正的体验,以及这种体验是否反映在他们的评论中。在确定评论是否可疑时,我们分析了各种因素,其中可能包括评论者是否使用了从其他来源复制的数据(例如在其他地方生成的数据,包括生成AI模型)。
当这些因素引起高度怀疑时,我们将自动删除审查,并让审查者知道我们已经采取了行动,给他们一个挑战我们决定的机会。
我们认为,当涉及到这项新兴技术时,这是正确的平衡,承认审稿人可能会使用基于生成ai的工具来帮助构建真实的体验或支持审稿人的需求,例如可访问性或神经多样性。
ZDNET: Trustpilot如何平衡自动检测与im的需求人类监督的重要性?
AJ:考虑到平台的未来,我们一直并将始终确保人类参与到我们开发的自动化软件的设计和实现中来。
我们承认自动化在支持大规模运营方面是有影响力的,但我们正在解决的问题的本质是人为的。这些问题和挑战随着时间的推移而变化,因此自动化需要适应,而这种适应通常是由我们从人类行为中学到的东西驱动的。
ZDNET:这些年来,被检测到的虚假评论的百分比是如何变化的因为这个?
AJ:在Trustpilot上撰写的评论总数逐年增加,从4600万(2022财年)增加到5400万(2023财年),增长了17%。因此,2023财年删除了更多虚假评论,总数为330万条,而2022财年为260万条。然而,我们的去除率保持不变,占同比总量的6%。
2023年,我们的假评论检测系统发现并删除了79%的假评论,这表明我们在自动检测假评论技术上的持续投资正变得越来越有效。虽然人工智能和机器学习继续快速发展,但生成式人工智能工具允许从几个简单的提示快速创建书面信息。
最近的研究表明,一项研究的参与者区分人类和人工智能文本的准确率只有50-52%。今天,我们在技术上的投资是为了更好地检测行为模式,这些模式既关注评论如何进入平台,也关注评论的具体内容,这意味着我们将继续识别和删除可疑的评论,即使这些评论的内容可能是使用人工智能生成的。
此外,Trustpilot上的社区帮助我们促进和保护平台上的信任。如果我们的审查者和商业团体认为它违反了我们的指导方针,他们可以在任何时候向我们标记一个审查。我们将标记给我们的那些评审称为报告评审。
通过利用人工智能和机器学习等技术以及我们的社区,我们能够继续提供一个基于信任和透明度的平台。
ZDNET:虚假评论对公司的长期影响是什么消费者信任和商业信誉?
AJ:虚假评论能够影响消费者的决定。根据虚假评论进行购买的消费者最终可能会获得糟糕的体验,或者至少不是他们所期望的体验。这最终影响了他们对在线平台的信任。
如果平台不能尽其所能减少虚假评论的可能性,这将产生长期影响,因为消费者最终会对他们赖以做出购买决定的平台失去信心。
ZDNET:什么道德公司考虑因素如何指导Trustpilot在审核审核中使用人工智能?
AJ:归根结底,这是我们对透明度的承诺。当我们使用人工智能进行自动决策时,我们对这一事实是透明的。我们为消费者和企业之间的信任设计我们的平台。
在为我们的平台使用和开发人工智能工具时,这种透明度是我们采取的方法的核心,也是消费者越来越期待的东西
ZDNET:你们是如何教育学生的nsumers一如何区分真实评论和虚假评论?
AJ:我们使用信任信号来突出经过验证的评论,而且评论者有能力验证他们自己。我们致力于高标准的验证,以确保浏览Trustpilot的消费者能够区分我们平台上不同类型的评论。
这是我们承诺在我们所做的一切中保持透明度的另一个方面。当我们对滥用平台的企业采取执法行动时,我们会展示显著的横幅(我们称之为消费者警告),以帮助消费者做出更明智的选择。
ZDNET:您如何看待人工智能在打击虚假评论方面的未来发展?
AJ:在我们这样的平台上使用人工智能有很多机会。生成式人工智能特别擅长模式预测,我很想知道如何利用该技术更好地识别虚假评论。我们从2007年开始运营,在判断哪些评论是假的,哪些评论是真的方面拥有大量的数据和经验,帮助我们建立更好的假检测模型。
同样重要的是要认识到,这些技术可以用来促进更大的透明度,利用技术来支持和引导人们上网,这是我们在网上聊天时经常看到的。这项技术只会随着时间的推移而改进,但随着这种复杂程度的提高,一种深刻的责任感也随之而来。
ZDNET:您对o的未来发展有何设想在线评论?
AJ:从更广泛的网络来看,我认为人工生成的内容和人工智能生成的内容之间的差距会越来越大,这会影响人们对在线内容的信任。因此,基于真实的人的经验,由真实的人创造的内容在未来将变得越来越有价值。
像Trustpilot这样的平台,我们在技术、人员、社区和流程方面进行了投资,以突出真实、真实的声音和观点,将为消费者和企业提供更有意义的价值。
ZDNET的编辑和我想向Anoop Joshi表示感谢,感谢他参与了这次深度采访。这里有很多值得思考的东西。谢谢你,Anoop。
你觉得呢?这些建议对你如何在网上评论的海洋中穿行有什么启发吗?请在下面的评论中告诉我们。
你可以在社交媒体上关注我每天的项目更新。一定要订阅我的每周更新时事通讯,并在Twitter/X @DavidGewirtz, Facebook Facebook.com/DavidGewirtz, Instagram Instagram.com/DavidGewirtz和YouTube YouTube.com/DavidGewirtzTV上关注我。