三花 AI 快讯

采用 CC BY-NC-SA 4.0 - 非商业性使用 - 相同方式共享 4.0 国际进行许可

2024, 11月21日

11月21日

2024, 11月21日

DeepSeek 推出全新推理模型 R1-Lite 预览版

DeepSeek 全新研发的推理模型预览版 DeepSeek-R1-Lite 现已正式上线网页版。R1 系列模型采用强化学习训练，推理过程中包含大量反思和验证，思维链长度可达数万字。该系列模型在数学、代码以及各种复杂逻辑推理任务上，取得了媲美 o1-preview 的推理效果。

目前，DeepSeek-R1-Lite 仍处于迭代开发阶段，仅支持网页使用，暂不支持 API 调用。官方表示，正式版 DeepSeek-R1 模型将完全开源，并公开技术报告和部署 API 服务。

还得是 DeepSeek，加油！

2024, 11月21日

OpenAI 的 GPT-4o 模型重夺竞技场榜首

#大模型,更新

OpenAI 发布了 GPT-4o 的新版本，其写作能力现在更加自然、吸引人且富有个性，进一步提高了相关性和可读性。

同时，4o 模型在 lmarena 上超越了谷歌的 Gemini 1114 模型，重新夺得了榜首。从得分来看，新版本在创意写作、数学和编码方面都有显著提升。

2024, 11月21日

谷歌推出 LearnLM 1.5 Pro Experimental：专为教育研究微调的 AI 模型

#大模型,更新

谷歌 AI Studio 最近上线了一个新模型 LearnLM 1.5 Pro Experimental ，这是一个专门针对学习和教育研究进行微调的模型系列。早在今年 5 月份，谷歌就发布了一篇文章来介绍这个模型。

我试下，常规任务的表现与 Gemini-Pro 差不多，但在文学能力方面，感觉比最新的 1114 模型还要好。不过，这个模型的上下文窗口只有 32k。

2024, 11月20日

11月20日

2024, 11月20日

Perplexity 推出 AI 购物助手：一键购物，商家免费入驻

#更新,AGENT

Perplexity AI 推出了一站式的 AI 购物助手，支持文字提问或拍照提问，Perplexity 会像私人购物顾问一样为你提供需求分析和产品推荐。

如果你在美国，可以一键购买，享受免费送货上门服务。此外，商家也可以免费入驻，入驻后不仅能提高推荐概率，还提供数据分析和支付集成等服务。

2024, 11月20日

Suno 发布 V4 版本：提升音频质量与创意歌词

#音乐,更新

Suno 之前发布了多个 V4 版本的预告，今天终于正式发布了！新版本能够生成具有更好音频质量、更清晰歌词和更动态歌曲结构的歌曲。此外，Suno V4 还带来了以下新功能：

重制（Remaster）：将你之前的音乐升级到 V4 级高质量音频。
歌词：为你的歌曲创作更具创意和更高质量的歌词。
封面：根据你音乐的氛围设计全新的封面艺术。

Suno 在音乐生成的竞争对手好像没有几个能打的，我知道就海绵音乐，还有别的吗？

2024, 11月20日

清华发布 DanceFusion：基于音乐的 AI 编舞

#跳舞,视频,动画,姿势

DanceFusion 是由清华发布的一个基于音乐生成编舞 OpenPose（姿势）视频的项目。它可以作为 AI 虚拟跳舞主播预处理的一环，不过目前该项目仅发布了论文。

2024, 11月20日

马斯克预言 2026 年将实现通用人工智能

#AGI

马斯克在直播玩大菠萝的切片视频中，预言 2026 年将实现AGI，并表示有1%概率我们的文明将直接Over。

他还表示他家的 Optimus 机器人可以变身猫娘、帮你接孩子、教孩子一切知识。未来量产Optimus 机器人的成本将低于一辆汽车，还讨论了未来战争形态、机器人数量比例等等，完整的内容直接看视频吧。

2024, 11月20日

InstantX 推出 SD3.5-Large 风格迁移 IP-Adapter

#风格转移,图片

InstantX 团队布了适用于 SD3.5-Large IP-Adapter 。自从 SD3.5 改用了更宽松的开源协议，生态也是好起来了。

2024, 11月20日

谷歌 Gemini 推出了类似 ChatGPT 的记忆功能

谷歌 Gemini 推出了类似 ChatGPT 的记忆功能，用户可以让 Gemini 记住自己的兴趣和爱好，能让 AI 提供更有用、更相关的回复。

不过这个功能需要订阅 Advanced 才能使用。

2024, 11月19日

11月19日

2024, 11月19日

ComfyUI 1.4.2 推出全新 Beta 蒙版编辑器

#COMFYUI,开源,更新

ComfyUI 将在发布 0.3.0 后将新 UI 设为默认值，改进了 reroute、编组选择、嵌套组等操作。

在 UI 的 1.4.2 版本（是的，UI 和核心的版本是分开的）中，引入了一个全新的蒙版编辑器，相比旧版更加人性化和易用。这个新编辑器功能目前还在 Beta 阶段，你可以随时切换回老版。

三花快讯