Alphabet首席执行官桑达尔·皮查伊(Sundar Pichai)表示5月10日,在加州山景城举行的谷歌I/O活动上,他谈到了谷歌DeepMind。周三,谷歌在人工智能领域迈出了又一步,推出了一个名为Gemini的项目,该项目经过训练,可以更像人类一样思考,并以可能加剧辩论的方式行事关于这项技术的潜在前景和风险。谷歌DeepMind是Gemini背后的人工智能部门。AP-Yonhap
周三,谷歌(Google)推出了“双子座”(Gemini)项目,迈出了人工智能领域的又一大步。该项目是一种经过训练的人工智能模型,其行为方式与人类类似,这可能会加剧有关该技术潜在前景和风险的辩论。
Gemini的推出将分阶段展开,“Nano”和“Pro”这两个不太复杂的版本将立即被整合到谷歌的人工智能聊天机器人Bard和Pixel 8 Pro智能手机中。
有了双子座的帮助,谷歌承诺巴德会变得更加直觉,在涉及计划的任务上做得更好。谷歌表示,在Pixel 8 Pro上,Gemini将能够快速总结在设备上录制的录音,并在即时通讯服务上提供自动回复,从WhatsApp开始。
Gemini最大的进步要到明年年初才会出现,届时它的Ultra型号将用于推出“Bard Advanced”,这是一个增强版的聊天机器人,最初只会向测试用户提供。
虽然谷歌高管在一次新闻发布会上向记者保证,这项技术最终将在其他语言中实现多样化,但这种人工智能在全球范围内只支持英语。
根据对一群记者的演示,谷歌的“Bard Advanced”可能能够同时识别和理解涉及文本、照片和视频的演示,从而实现前所未有的人工智能多任务处理。
Gemini最终也将被纳入谷歌的主要搜索引擎,不过具体的过渡时间尚未公布。
“这是人工智能发展的一个重要里程碑,也是我们谷歌新时代的开始,”双子座背后的人工智能部门谷歌DeepMind的首席执行官戴米斯·哈萨比斯(Demis Hassabis)宣布。近十年前,谷歌击败了包括Facebook母公司meta在内的其他竞购者,收购了总部位于伦敦的DeepMind,并将其与“大脑”部门合并,专注于Gemini的开发。
这项技术的解决问题的能力被谷歌吹捧为特别擅长数学和物理,这让人工智能乐观主义者燃起了希望,认为它可能会带来改善人类生活的科学突破。
但人工智能辩论的另一方担心,这项技术最终会使人类的智慧黯然失色,导致数百万人失去工作,甚至可能造成更具破坏性的行为,比如放大错误信息或引发核武器的部署。
谷歌首席执行官桑达尔·皮查伊在一篇博客文章中写道:“我们正在大胆而负责任地开展这项工作。”“这意味着我们的研究要雄心勃勃,追求能够为人类和社会带来巨大利益的能力,同时建立保障措施,并与政府和专家合作,在人工智能变得更有能力的时候应对风险。”
在过去的一年里,旧金山初创公司OpenAI和长期的行业竞争对手微软(Microsoft)之间的人工智能竞争一直在升级,Gemini的到来可能会加大竞争的力度。
在微软的财力和计算能力的支持下,OpenAI在去年年底发布免费的ChatGPT工具时,已经在深入开发其最先进的人工智能模型GPT-4。这个由人工智能驱动的聊天机器人迅速蹿红全球,为生成式人工智能的商业前景带来了嗡嗡声,并迫使谷歌推出了巴德作为回应。
就在巴德出现的时候,OpenAI在3月份发布了GPT-4,并一直在开发针对消费者和企业客户的新功能,其中包括11月份发布的一项功能,该功能使聊天机器人能够分析图像。它一直在与其他人工智能初创公司竞争业务,比如Anthropic,甚至是它的合作伙伴微软(Microsoft)。微软向OpenAI投入了数十亿美元,获得了OpenAI技术的专有权。
到目前为止,这一联盟对微软来说是一个福音,今年迄今为止,微软的市值已经攀升了50%以上,主要是因为投资者相信人工智能将成为科技行业的一座金矿。谷歌的母公司Alphabet也赶上了这股潮流,今年以来市值增长超过5000亿美元,涨幅约为45%。尽管近几个月来人们对Gemini充满了期待,但Alphabet的股价在周三的交易中仍小幅下跌。
在过去的一年里,微软对OpenAI的参与越来越深,再加上OpenAI更积极地尝试将其产品商业化,这让人们担心,随着技术的进步,这家非营利组织已经偏离了保护人类的最初使命。
上个月,OpenAI董事会突然解雇了首席执行官山姆?奥特曼,原因是一场围绕未公开的信任问题的纠纷,这种担忧被放大了。OpenAI遭到强烈反对,威胁到公司的生存,导致人工智能工程人才大量流失到微软。在此之后,OpenAI让奥特曼重新担任首席执行官,并改组了董事会。
随着Gemini的问世,OpenAI可能会发现自己试图证明自己的技术仍然比谷歌的更聪明。
“我对它的能力感到敬畏,”谷歌DeepMind产品副总裁伊莱·柯林斯(Eli Collins)谈到Gemini时说。
在一个虚拟的新闻发布会上,Google拒绝分享Gemini的参数计数——一个但不是模型复杂性的唯一度量。周三发布的一份白皮书概述了最强大的Gemini版本,该版本在多项选择题考试、小学数学和其他基准测试中表现优于GPT-4,但承认在让人工智能模型达到更高水平的推理技能方面仍在努力。
一些计算机科学家看到了大型语言模型的局限性,这些模型通过反复预测句子中的下一个单词来工作,并且容易产生被称为幻觉的错误。
“我们在双子座的真实性方面取得了巨大的进步。所以双子星座是我们在这方面最好的模型。但我想说,这仍然是一个未解决的研究问题,”柯林斯说。(美联社)