Apple 用LLM图像编辑工具加速了生成式AI

苹果正在通过引入一款名为Keyframer的强大新工具在生成AI(genAI)领域取得重大进展。这个工具让用户通过利用文本提示轻松地为静态图像添加动画效果。

在最近发布的一篇苹果研究论文中详细介绍了Keyframer的强大功能。用户只需输入SVG图像、提供文本提示,Keyframer便能生成原始图像的CSS动画代码,将静态的2D图像转换为动态的插画。随后,用户可以对动画进行微调,使其符合个人喜好。

这一最新创新进一步丰富了苹果与AI相关的产品组合,表明了公司在这一领域取得的承诺。苹果在AI领域的隐秘努力导致了众多突破性成果的揭示,显示了公司在这一领域的巨大投资。随着发展步伐的加快,显然苹果致力于在AI竞争中保持领先地位。

今年早些时候,苹果推出了MLLM-Guided Image Editing(MGIE)工具,通过文本命令实现像素级图像编辑。苹果技术的整合表明了与Siri兼容的潜在性,可执行编辑命令,承诺产生与James Fridman Twitter动态相似的惊人效果。

关于苹果收购iWork.ai域名的传闻引发了人们对将genAI集成到其设备中的猜测。

此外,苹果的机器学习团队自年初以来已发表了16篇研究论文/讨论,重点关注LLM开发、医疗保健、语音识别等领域。

2023年末,苹果推出了三项重大技术:在设备上高效执行基于大型语言模型(LLM)的AI、面向苹果Silicon的ML Explore机器学习框架以及用于机器学习的优化工具Ferret。此外,团队还开发了一个能够快速生成视频头像的模型。

苹果还在大力投资于人工智能初创公司,有报道称其对德国公司brighter AI表现出兴趣,该公司专注于图像隐私保护。

过去一年中,苹果似乎在AI公司收购方面处于领先地位,共进行了32笔收购,战略地定位在机器图像智能和AI等领域。

苹果将隐私视为一项基本权利,这表明了其致力于开发优先考虑设备内处理的工具。这与公司之前在边缘AI处理方面的研究相一致。

CEO蒂姆·库克承诺将在今年晚些时候分享更多有关苹果AI工作的细节,很可能会在2024年6月的WWDC上发布,与新操作系统的发布同时进行。

风险很高,Counterpoint最近预测,到2027年,将有近10亿台装备了GenAI的智能手机出货。为了保持在智能手机市场的主导地位,苹果必须继续在genAI领域创新。将genAI功能整合到iPhone中可能会超出行业预期,表明智能手机技术发生了重大转变。未来几个月将揭示Siri是否将成为这一变革过程的一部分。

联系方式
回顶部