Meta 公开了 Google 的 NotebookLM 中广受欢迎的生成播客功能的“开源”版本。
名为 NotebookLlama 的项目在处理过程中主要使用了 Meta 自家的 Llama 模型。类似于 NotebookLM,NotebookLlama 能够将上传的文本文件转换成对话形式的播客摘要。
NotebookLlama 首先从文件中(如新闻文章或博客文章的 PDF)生成文字记录。接着,它在文字记录中加入更多戏剧化元素和中断,然后将这些内容输入到开源的文本转语音模型中。
结果的音质明显不如 NotebookLM。在听过的 NotebookLlama 示例中,声音带有明显的机器人声,并且在某些地方会出现相互重叠的情况。
然而,该项目背后的 Meta 研究人员指出,采用更强大的模型可以提升音质。
“文本转语音模型是限制音质自然度的关键因素,”他们在 NotebookLlama 的 GitHub 页面上指出。“[另外],另一种制作播客的方法是让两个代理就感兴趣的主题进行辩论,并撰写播客大纲。目前我们仅使用单一模型来撰写播客大纲。”
NotebookLlama 并非首个尝试复制 NotebookLM 播客功能的项目。一些项目比其他项目更成功,但即便是 NotebookLM 本身,也未能解决所有人工智能普遍存在的幻觉问题。换言之,人工智能生成的播客内容中总会包含一些虚构元素。