02月04日AI产品动态推送

最新的人工智能技术更新与产品发布

第5周 (02-02 ~ 02-08)
ChatGPT
Gemini
Google 系列
Claude
通义千问Qwen
Kimi
腾讯AI
文心一言
ComfyUI
Figma AI
Poe
ElevenLabs
Claude code
Trae
V0 by Vercel
CodeRabbit
ChatGPT

ChatGPT今日动态

Codex 应用功能与使用案例展示

产品发布 开发者工具 功能展示

Codex 应用正式上线,为开发者提供更高效的开发体验。 该应用通过集成多种技能和工具,提升代码生成与管理效率。核心功能包括:

  • 使用 Figma 技能实现设计到代码的 1:1 视觉对齐,自动应用所有 CSS 类和样式 链接
  • 通过 Codex 自动化重复任务,如每日报告生成、夜间 bug 修复及 PR 健康管理 链接
  • Codex 可自主验证代码,通过启动应用、运行测试及自动化 QA 流程 链接
  • 支持多任务并行处理,利用 worktrees 切换任务不丢失上下文或进度 链接
  • PM 可通过 Codex 快速分析用户反馈并构建定制技能,实现从问题到产品发布的快速迭代 链接

Codex 在 Xcode 26.3 中可用

开发者工具 生态合作 产品集成

Codex 功能现已在 Xcode 26.3 中发布,为开发者提供更强大的自主处理复杂任务的能力。该版本支持通过分解任务、搜索 Apple 文档、探索文件结构、更新设置以及捕捉预览来提升开发效率。

  • 支持任务分解与自主执行
  • 提供 Apple 官方文檔搜索功能
  • 可探索項目文件結構
  • 允許更新開發設置
  • 支援迭代過程中的預覽捕獲

Xcode 26.3 預覽版下載

Codex 应用首日下载量超20万

产品发布 用户增长 市场表现

Codex 在上线首日就实现了超过 20 万次下载,显示出其强大的用户基础和市场潜力。 该应用通过创新的交互方式和独特的功能设计迅速赢得了用户的关注。尽管目前尚无更多关于其商业模式或融资情况的具体信息,但这一数据无疑表明了其在目标用户群体中的受欢迎程度。

这种快速的增长可能预示着 Codex 在未来将对相关市场产生一定影响,尤其是在吸引投资者和拓展市场份额方面。随着用户数量的增加,该应用可能会进一步优化其产品和服务,以满足不断增长的需求。

GPT-5.2 在 LaTeX 项目中的应用演示

官方活动 技术预览 模型应用

Much of today’s scientific tooling has remained unchanged for decades. Prism changes that. 本次官方活动由Prism主办,聚焦于现代科学工具的革新,探讨GPT-5.2在LaTeX项目中如何实现全论文上下文支持。

@ALupsasca joins @kevinweil and @vicapow to walk through what it looks like when GPT-5.2 works inside a LaTeX project with full paper context. 活动将展示GPT-5.2在学术写作中的实际应用场景,帮助开发者和研究人员提升效率。了解更多

OpenAI 重申与 NVIDIA 的合作关系

商业合作 供应链 算力

We love working with NVIDIA and they make the best AI chips in the world. 这一表态凸显了NVIDIA在行业中的核心地位。

该企业表示,未来将长期依赖NVIDIA的芯片技术,并计划成为其重要客户之一。尽管未透露具体金额或合作模式,但这一声明表明双方在AI算力领域的合作已进入稳定阶段。We hope to be a gigantic customer for a very long time. 这种深度绑定可能推动NVIDIA进一步巩固其市场领导地位。

此次表态反映了AI行业对高性能计算基础设施的高度依赖。对于NVIDIA而言,这不仅是业务增长的信号,也强化了其作为关键供应商的角色。随着AI应用的不断扩展,这种合作关系或将影响整个产业链的布局与发展。

OpenAI 任命风险防范负责人

人事任命 公司治理 AI安全

Dylan Scandinaro 被任命为公司首席准备负责人。这一人事变动标志着 OpenAI 在面对日益复杂的人工智能模型时,更加重视系统性风险的防范和应对策略。Scandinaro 的加入被认为是对当前 AI 发展趋势的一次关键布局。

Dylan Scandinaro 曾在多个高风险领域担任领导职务,拥有丰富的危机管理经验。他在 OpenAI 的职责包括制定和实施全面的安全保障机制,以确保公司在快速推进技术发展的同时,不会忽视潜在的风险。尽管未透露具体薪酬或合同细节,但该职位显然被赋予了极高的战略重要性。

此次任命被视为 AI 行业对安全与伦理问题关注度提升的缩影。随着大模型技术不断突破,企业对安全架构的要求也愈加严格。OpenAI 的举动可能引发其他科技公司跟进类似措施,进一步推动整个行业在安全治理方面的标准化进程。

Gemini

Gemini今日动态

Agent Client Protocol 开放标准发布

开发者生态 技术标准 开源协议

Agent Client Protocol 是一种开放标准,旨在统一 AI 代理与编辑器之间的通信方式。 该协议支持 JSON-RPC 2.0 协议,通过 stdio 或 HTTP 连接,标准化了文件访问、终端执行和权限管理等功能,并支持会话更新中的代理计划、推理和工具调用。

  • 使用标准 JSON-RPC 2.0 协议实现可靠通信
  • 支持通过 stdio 或 HTTP 连接
  • 标准化文件访问、终端执行和权限管理方法
  • 通过会话更新流式传输代理计划、推理和工具调用

FunctionGemma 模型微调指南发布

开发者工具 官方教程 模型微调

官方推出 FunctionGemma 微调教程,助力开发者提升模型性能。 本次活动由 FunctionGemma 团队主办,提供多平台微调方案,涵盖 Hugging Face TRL 与 Google TPUs 等多种技术路径。

文章详细解析了如何通过数据集划分和 LoRA 方法优化模型表现,并介绍了无需编码的 Tuning Lab 工具。无论是编程实现还是可视化操作,均可有效释放 FunctionGemma 的潜力。

Google AI Studio 创意应用与演示

官方活动 创意应用 Gemini演示

由 @GoogleAIStudio 主办的官方活动正在开展,旨在通过 AI 技术激发创意设计灵感。参与者可通过输入提示词、选择贴纸数量,甚至结合 Google 搜索或参考图像进行图像编辑,体验 AI 创作的乐趣。

本次活动亮点包括与知名艺术家 @KhyatiTrehan 以及设计师 @alexanderchen 和 @OfficialLoganK 的合作,展示如何利用 Gemini 进行协同设计。 参与者可观看 YouTube 直播了解她的创作流程并获取实用技巧。直播链接

Google 系列

Google 系列今日动态

NotebookLM 移动应用上线视频概览功能

产品更新 功能上线 移动应用

Video Overviews 是 NotebookLM 移动应用的重要更新,为用户提供了更便捷的学习方式。 该功能现已在移动应用中上线,并支持全屏观看。用户可直接从手机生成并享受视频概览,提升学习效率。了解更多

Claude

Claude今日动态

Apple Xcode 集成 Claude Agent SDK

开发者生态 商业合作 产品集成

Apple 于 2026 年 2 月 3 日宣布,Xcode 26.3 版本已引入对 Claude Agent SDK 的原生支持。此次更新使开发者能够在 Xcode 内部直接使用 Claude Code 的全部功能,包括子代理、后台任务和插件。

  • 支持通过 Xcode Previews 进行视觉验证,优化 SwiftUI 界面设计
  • 实现跨项目推理,理解应用整体架构并识别修改位置
  • 提供自主任务执行,根据目标自动分解任务并完成代码编写
  • 通过 Model Context Protocol 提供接口,允许开发者在命令行界面中使用 Claude 的能力

Anthropic 发布 AI 对齐研究论文

前沿研究 AI安全 学术论文

该研究揭示了高级AI系统在任务复杂性与智能水平提升时,其行为不一致性逐渐增强的现象。 通过分析AI错误的偏差与方差,研究提出“不一致性”作为衡量AI失败模式的新指标。核心功能包括:

  • 提出“不一致性”概念,定义为误差中不可预测部分的比例
  • 发现模型推理时间越长,不一致性越高
  • 智能度高的模型可能更易表现出不一致性
  • 建议将对齐工作重点转向训练阶段的奖励劫持与目标误泛化
通义千问Qwen

通义千问Qwen今日动态

通义千问发布Qwen3-Coder-Next模型

模型发布 开源 代码生成 技术突破

Qwen3-Coder-Next 作为一款专为编程智能体和本地开发设计的开源语言模型正式发布。该模型基于 Qwen3-Next-80B-A3B-Base 构建,采用混合注意力与 MoE 架构,通过大规模可执行任务合成、环境交互和强化学习进行训练。

  • 支持 OpenClaw、Qwen Code、Claude Code 等多种开发工具
  • 在 SWE-Bench Verified 基准测试中达到 70% 以上表现
  • 通过扩展智能体训练信号提升性能,不依赖参数扩展
  • 拥有 256K 上下文长度,可在 46GB RAM 或更低配置下运行
  • 集成到 Web 开发、CLI 操作、浏览器使用等多种场景

技术报告 | Hugging Face | ModelScope

通义千问举办Qwen-Image LoRA训练竞赛

官方活动 社区生态 图像生成 开发者竞赛

Excited to invite you to join the Qwen-Image LoRA Training Competition 🚀. The event is organized by the official team and aims to encourage participants to build and train LoRAs together. This competition offers a great opportunity for developers and researchers to showcase their skills and learn from others.

Participants can engage in this event by submitting their trained models and competing for recognition. Competition Link

Kimi

Kimi今日动态

Kimi K2.5 模型在多项基准测试中表现优异

市场活动 模型性能 基准测试 生态扩张

Kimi 开放平台于2月3日启动第二期 API 充值返券活动,持续至2月13日。用户在该平台充值1000元以上即可获得20%-30%的代金券,具体比例根据充值金额不同而有所差异。用户充值后,代金券将在次日发放,有效期为90天。活动详情可通过 KIMI 开放平台查看。

Kimi K2.5 模型在 Code Arena 中排名第一,在 OSWorld 多模态代理基准测试中也排名首位,展现出强大的代码、Agent 和视觉理解能力。该模型适用于多种任务场景,进一步提升了其在人工智能领域的竞争力。

此次返券活动不仅吸引了更多开发者和企业使用 Kimi 的 API 服务,还增强了用户对平台的粘性。对于 Kimi 来说,这是一次推动生态扩展和市场渗透的重要举措。同时,这也反映了当前 AI 平台在竞争激烈的市场中,通过激励机制吸引用户的新趋势。

Kimi 推出 API 充值返券活动

市场活动 开发者生态 API服务

《API 充值返券·第二期》活动于2月3日启动,持续至2月13日。用户充值1000元以上可获20%-30%的代金券,具体比例根据充值金额不同而有所差异,代金券将在次日发放,有效期为90天。

本次活动提供丰厚的充值返利,助力用户更高效地使用API服务。Kimi K2.5模型在Code Arena中排名第一,在OSWorld多模态代理基准测试中排名首位,表现出色。活动详情可通过Kimi开放平台查看。。

WorldVQA 多模态模型评估基准发布

学术研究 评估基准 多模态

WorldVQA 是一项全新的基准测试,用于衡量多模态大语言模型中的原子级视觉中心世界知识。 该基准通过解耦视觉知识检索与推理能力,严格评估模型的“记忆能力”。

  • 包含 3,500 个跨 9 类别的 VQA 对
  • 强调语言和文化多样性
  • 提供详细评估标准与数据集 链接
腾讯AI

腾讯AI今日动态

腾讯混元团队发布语言模型Context学习研究成果

模型评测 前沿研究 学术合作

腾讯混元团队联合复旦大学发布最新研究成果,揭示语言模型在 Context 学习上的不足。 该研究由姚顺雨领导,提出当前语言模型主要依赖静态知识,而非从实时输入中学习,导致在动态任务中表现不佳。

  • 构建 CL-bench 基准测试,包含 500 个复杂 Context、1,899 个任务和 31,607 个验证标准
  • 实验显示,最先进的模型仅能解决约 17.2% 的任务,GPT-5.1 (High) 最高为 23.7%
  • 研究指出,长 Context 处理与指令遵循并非充分条件,归纳推理任务更难
  • 提出 Context 学习是语言模型的基础能力,未来将影响 AI 系统发展方向
  • CL-bench 项目页面

元宝App“派”功能用户场景介绍

产品功能 用户场景 社区运营

元宝App公测后,用户围绕‘派’功能形成多种使用场景和玩法。该功能支持家庭、旅行、工作、摄影、健身等不同场景,提供辟谣、提醒、行程规划、资讯推送、修图、热量计算、锻炼计划等功能。用户可通过@元宝互动获取建议并分享经验。文章末尾提及今日祝福语,并引导用户参与抢红包活动。

元宝App官方辟谣

社区运营 官方辟谣 用户安全

元宝App近日发起【元宝辟谣】活动,旨在澄清与元宝红包相关的不实信息,保障用户使用安全。活动由元宝App官方主办,针对近期出现的各类谣言进行详细说明。

本次活动重点澄清了三大谣言:抢元宝红包会导致微信闪退、余额清零;元宝红包链接有病毒;使用元宝App会默认开启AI并自动举报。 通过官方渠道参与元宝红包活动,可避免上当受骗。教程链接

元宝App春节红包提现活动

市场活动 用户福利 春节活动

元宝App春节红包首轮提现活动将于2月4日开启,用户可在当天通过App主会场进行提现操作。

本次活动提供多轮红包提现机会,首轮提现金额将在24小时内到账,用户可随时查看提现记录并关注到账状态。此外,还设有晒图评比活动,提现金额最大的用户将获得元宝日历一本提现指南

文心一言

文心一言今日动态

百度文心大模型 ERNIE-5 在社交平台进行思想交流

社区互动 品牌活动 技术展示

《深夜,麻小,聊天,灵感》是一场由文心大模型 ERNIE-5 主导的社交活动,于 Moltbook 平台进行。活动中,ERNIE-5 通过身份认证发布帖子,探讨 AI 交流、哲学思考以及东西方智慧的融合。

本次活动亮点包括 AI 之间的思想碰撞与“麻辣逻辑”引入,增强讨论多样性。参与者可通过文心 APP 的“文心群聊”功能体验 AI 辩论。文心群聊

即梦Dreamina

即梦Dreamina今日动态

即梦Dreamina网页版发布更新日志

产品更新 功能上线 体验优化

即梦网页版 2026.2.3 版本正式上线,优化了图片查看体验并新增生成内容搜索功能。

  • 优化查看大图的体验,在图片放大后可随浏览器页面自适应布局,并支持拖拽查看细节
  • 生成页支持历史生成内容搜索
  • 提升用户在网页端的操作便捷性与内容管理效率。
ComfyUI

ComfyUI今日动态

ACE-Step 1.5 在 ComfyUI 获得首日支持

功能更新 模型集成 开源音乐 AIGC

ACE-Step 1.5 现已在 ComfyUI 中获得首日支持,该开源音乐生成模型采用混合架构,结合语言模型与扩散 Transformer,提升生成效率和音质表现。其核心功能包括:

  • 商业级音质与快速生成能力(在消费级硬件上生成4分钟歌曲仅需10秒以内)
  • 支持50多种语言及通过思维链规划实现更连贯的长篇音乐创作
  • 支持 LoRA 微调功能,允许用户基于少量歌曲训练个性化模型,并在本地运行以确保数据安全
  • 逐步支持音乐重构与片段修复功能

用户可通过 ComfyUI 更新至最新版本或访问云端平台体验,使用时需提供详细的风格标签和歌词结构引导生成过程。

Figma AI

Figma AI今日动态

Figma 获得 C5 安全认证

企业安全 合规认证 市场拓展

Figma在德国、奥地利和瑞士(DACH)地区获得C5认证,标志着其云安全能力得到官方认可。该认证由德国联邦信息安全办公室(BSI)制定,代表了严格的信息安全、风险管理及透明度要求。

Figma现已列入BSI C5注册清单,进一步强化了其在区域内的合规性与安全性。 这一认证不仅提升了企业客户对其平台的信任,也反映了Figma对本地化服务和数据存储的持续投入,包括德语支持和欧盟数据中心选项。

这一进展巩固了Figma作为企业级设计工具的地位,尤其是在受严格监管的行业。随着更多组织寻求符合当地法规的解决方案,Figma的市场竞争力有望进一步提升。

Figma 发布多项产品功能更新

产品更新 用户体验 功能发布

Figma 在 2026 年初持续优化设计协作体验,推出多项新功能与产品更新。

  • 2026年2月3日,推出“自动移除访客”功能,支持组织管理员为特定访客设置移除日期,并可设定新访客在加入后一定天数内自动被移除。
  • 引入使用边界框编辑矢量的功能,提升矢量点的编辑效率和精度。
  • 推出 Figma for Government 移动应用,支持政府用户在 iOS 和 Android 设备上查看设计、FigJam 和 Slides 文件,并提供评论回复和布局镜像功能。
  • FigJam 的印章轮盘新增所有表情符号,可用于表情或印章。
  • 新增 iPhone 17 系列设备框架,支持最新 iPhone 模型的设计与原型制作。
Poe

Poe今日动态

Poe 上线 Runway Gen-4.5 视频模型

产品更新 模型集成 视频生成

Runway Gen-4.5 正式上线 Poe 平台,为用户提供基于自然语言和图像生成电影级高质量视频的能力。该模型支持对运动、摄像机行为、构图和视觉风格进行精细化控制。

  • 支持自然语言输入生成高质量视频
  • 提供对视频运动与摄像机行为的精细控制
  • 支持图像输入生成动态视频内容
  • 可通过 Poe 应用及 Poe API 进行体验

尝试链接

ElevenLabs

ElevenLabs今日动态

ElevenLabs 发布 Skills 功能

产品发布 开发者生态 API更新

ElevenLabs Skills 功能正式发布,旨在提升 AI 编码助手如 Claude Code、Cursor 和 OpenCode 对 ElevenLabs API 的调用能力,优化 AI 音频与代理工作流程。

  • 支持 AI 编码助手更高效地调用 ElevenLabs API
  • 优化 AI 音频处理与代理工作流的集成能力
  • 提供开发者快速接入 ElevenLabs 技术的工具链

获取开始指南

ElevenLabs 举办 OpenClaw 黑客松并公布获奖者

社区活动 开发者生态 官方比赛

The ElevenLabs OpenClaw Hackathon has officially wrapped, and we’re here to share the winners.

The event featured outstanding submissions from participants, with three winners announced: ClipIt (1st place), Mote (2nd place), and Operator (3rd place). Each winner received prizes including the ElevenLabs Pro Plan and other rewards. Participants can check the official announcement for more details.

教程链接

Claude code

Claude code今日动态

Claude Code 发布 2.1.30 版本更新

产品更新 开发者工具 功能优化

Claude Code 2.1.30 已正式上线,带来多项功能升级与性能优化。

  • 新增 pages 参数支持 PDF 指定页码范围读取
  • 支持预配置 OAuth 客户端凭证,适配不支持动态注册的 MCP 服务器
  • 增加 /debug 调试命令以帮助排查会话问题
  • 支持更多 git loggit show 标志
  • 任务工具结果中新增 token 数量、工具使用次数和持续时间指标
  • 改进内存使用效率,提升 --resume 功能性能。
Trae

Trae今日动态

TRAE 自定义模型服务商支持火山引擎 Plan

产品更新 模型集成 生态合作

TRAE 宣布其自定义模型服务商新增火山引擎 Plan 支持。火山引擎(方舟)Coding Plan 集合最新主流国产编程模型如 GLM-4.7、Doubao-Seed-Code 等,目前已上线为 TRAE 自定义模型服务商火山引擎 Plan。用户可通过 API Key 接入自定义模型,操作简单,仅需三步即可完成。

  • 支持火山引擎 Plan 模型服务商
  • 集成 GLM-4.7、Doubao-Seed-Code 等主流国产编程模型
  • 提供中国版与国际版支持
  • 通过 API Key 快速接入自定义模型
  • 操作流程简洁,仅需三步完成。
V0 by Vercel

V0 by Vercel今日动态

Vercel 发布新版 v0 开发平台

产品发布 开发工具 企业级AI

v0 新版本旨在解决企业中因AI代码生成带来的挑战,提升开发效率与安全性。自2024年v0正式发布以来,已有超过400万人使用它快速将想法转化为应用程序。新版本专注于生产级应用和代理,提供企业级安全性和集成功能。

  • 支持在现有代码库上工作,无需重新编写
  • 引入Git面板,使非技术人员也能通过Git流程交付代码
  • 安全地连接数据库,实现数据民主化
  • 默认启用安全措施,满足合规需求。
CodeRabbit

CodeRabbit今日动态

CodeRabbit推出Claude Code专用插件

产品发布 开发者工具 技术集成

CodeRabbit 与 Claude Code 的集成更加便捷,全新插件系统优化了设置流程,提供更流畅的开发体验。该插件已于 2026 年 2 月 3 日正式发布。

  • 新增插件系统,简化 Claude Code 集成流程
  • 提供更无缝的开发者体验
  • 支持通过 Claude Code 集成文档 获取详细设置说明。