Meta发布了Google播客生成器的"开源"版本

Meta 公开了 Google 的 NotebookLM 中广受欢迎的生成播客功能的“开源”版本。

名为 NotebookLlama 的项目在处理过程中主要使用了 Meta 自家的 Llama 模型。类似于 NotebookLM，NotebookLlama 能够将上传的文本文件转换成对话形式的播客摘要。

NotebookLlama 首先从文件中（如新闻文章或博客文章的 PDF）生成文字记录。接着，它在文字记录中加入更多戏剧化元素和中断，然后将这些内容输入到开源的文本转语音模型中。

结果的音质明显不如 NotebookLM。在听过的 NotebookLlama 示例中，声音带有明显的机器人声，并且在某些地方会出现相互重叠的情况。

然而，该项目背后的 Meta 研究人员指出，采用更强大的模型可以提升音质。

“文本转语音模型是限制音质自然度的关键因素，”他们在 NotebookLlama 的 GitHub 页面上指出。“[另外]，另一种制作播客的方法是让两个代理就感兴趣的主题进行辩论，并撰写播客大纲。目前我们仅使用单一模型来撰写播客大纲。”

NotebookLlama 并非首个尝试复制 NotebookLM 播客功能的项目。一些项目比其他项目更成功，但即便是 NotebookLM 本身，也未能解决所有人工智能普遍存在的幻觉问题。换言之，人工智能生成的播客内容中总会包含一些虚构元素。