Apple 用LLM图像编辑工具加速了生成式AI

苹果正在通过引入一款名为Keyframer的强大新工具在生成AI（genAI）领域取得重大进展。这个工具让用户通过利用文本提示轻松地为静态图像添加动画效果。

在最近发布的一篇苹果研究论文中详细介绍了Keyframer的强大功能。用户只需输入SVG图像、提供文本提示，Keyframer便能生成原始图像的CSS动画代码，将静态的2D图像转换为动态的插画。随后，用户可以对动画进行微调，使其符合个人喜好。

这一最新创新进一步丰富了苹果与AI相关的产品组合，表明了公司在这一领域取得的承诺。苹果在AI领域的隐秘努力导致了众多突破性成果的揭示，显示了公司在这一领域的巨大投资。随着发展步伐的加快，显然苹果致力于在AI竞争中保持领先地位。

今年早些时候，苹果推出了MLLM-Guided Image Editing（MGIE）工具，通过文本命令实现像素级图像编辑。苹果技术的整合表明了与Siri兼容的潜在性，可执行编辑命令，承诺产生与James Fridman Twitter动态相似的惊人效果。

关于苹果收购iWork.ai域名的传闻引发了人们对将genAI集成到其设备中的猜测。

此外，苹果的机器学习团队自年初以来已发表了16篇研究论文/讨论，重点关注LLM开发、医疗保健、语音识别等领域。

2023年末，苹果推出了三项重大技术：在设备上高效执行基于大型语言模型（LLM）的AI、面向苹果Silicon的ML Explore机器学习框架以及用于机器学习的优化工具Ferret。此外，团队还开发了一个能够快速生成视频头像的模型。

苹果还在大力投资于人工智能初创公司，有报道称其对德国公司brighter AI表现出兴趣，该公司专注于图像隐私保护。

过去一年中，苹果似乎在AI公司收购方面处于领先地位，共进行了32笔收购，战略地定位在机器图像智能和AI等领域。

苹果将隐私视为一项基本权利，这表明了其致力于开发优先考虑设备内处理的工具。这与公司之前在边缘AI处理方面的研究相一致。

CEO蒂姆·库克承诺将在今年晚些时候分享更多有关苹果AI工作的细节，很可能会在2024年6月的WWDC上发布，与新操作系统的发布同时进行。

风险很高，Counterpoint最近预测，到2027年，将有近10亿台装备了GenAI的智能手机出货。为了保持在智能手机市场的主导地位，苹果必须继续在genAI领域创新。将genAI功能整合到iPhone中可能会超出行业预期，表明智能手机技术发生了重大转变。未来几个月将揭示Siri是否将成为这一变革过程的一部分。

相关推荐

回顶部