如何用谷歌的NotebookLM |企业家制作人工智能播客

2025-03-30 14:37来源:本站

  

  

  

  本月早些时候,谷歌为其人工智能研究和写作工具NotebookLM提供了一个实验性的音频概述功能,可以将任何资源集合转换为两个人工智能主持人之间的播客讨论。谷歌宣传人工智能的讨论是可下载的,吸引人的,是听觉学习者的工具。

  但它听起来也像两个人之间的播客,节奏、语气和表达都很熟练——在尝试之后,我认为这个工具可以激发人类播客的灵感。

  谷歌副总裁乔希·伍德沃德在5月份的谷歌I/O大会上预览了这一功能,他说:“你可以给[NotebookLM]以任何格式的大量信息,它可以以一种个性化和交互式的方式进行转换。”

  出于好奇,我对这个功能进行了测试。

  谷歌承认,在现阶段,NotebookLM的人工智能播客仅限于英语音频,它们“有时会引入不准确的内容”。它们还没有互动,不能被打断。

  我首先进入NotebookLM,创建了一个新的笔记本。然后我开始增加资源,专注于广泛、密集、公开的材料——我在公共领域找到了从音乐理论到微积分的所有教科书。

  谷歌NotebookLM。信贷:企业家

  谷歌允许每个笔记本多达50个资源。我可以从笔记本电脑上上传PDF、。txt或Markdown文件,也可以通过Google Docs、Google Slides、网站链接选择来源,然后复制和粘贴文本。

  我主要依靠网站链接和pdf文件,并选择了八个来源,每个来源都来自不同的学科,有数百页。列奥纳多·达·芬奇对艺术和生活的思考,西尔瓦努斯·汤普森的《微积分变得简单》,罗伯特·哈钦森的开放许可大学教科书《21世纪课堂乐理》,詹姆斯·b·科南特的《有机合成》,埃德加·瑟斯顿的《印度南部的预言和迷信》,以及雅各布·约书亚·利维森的《树木研究》。

  我还加入了一些哲学:《超越善恶》和《理想国》,都是通过古腾堡计划完成的。我想看看AI播客如何在文本之间建立联系,我想知道AI如何将它们处理成可理解的音频。

  上传完资料后,我点击了“笔记本指南”,转到“音频概述”,点击了“深度对话”旁边的“生成”按钮。

  生成按钮。信贷:企业家

  3分57秒后,音频概述完成。这首歌长8分53秒,有两种声音,一种是女性,一种是男性。

  “好吧,所以你认为幸运袜很酷,”一个女声开始了播客。“我们要做好准备,因为今天我们要做的远不止这些。”

  “远远不止这些,”那个男性的声音补充道。

  呈现的音频很吸引人,两位主持人之间不断地来回交流,但它只关注埃德加·瑟斯顿的文本,而忽略了其他一切。这篇文章并不是列表上的第一个来源,我也没有以任何方式把它挑出来——AI似乎是随机挑选出来的。人工智能主持人呈现文本的方式令人印象深刻且具有对话性,但我希望看到更全面的内容,包括所有来源并在它们之间建立联系。

  当我删除Thurston文本并尝试重新加载音频概述时,它立即提供给我它已经生成的播客,即使音频不再与源对齐。

  我可以轻松地下载播客,即使音频只关注一个来源,它也会深入到来源并使其易于理解。对于学生来说,我可以看到它是一个有用的学习辅助工具,或者是一种理解更密集的书面文本的方式。对于任何想要理解密集研究或书籍的人来说,这个工具可以提供足够的音频对话,足以应付早晨的通勤。

  拥有一个个性化的播客是一个强大的工具——在我自己创建了一个播客之后,我想说这是人工智能的一个强有力的用例。

一物网声明:未经许可,不得转载。