🤖 AI信息

追踪人工智能领域最新技术动态、产品发布、研究突破

2026年2月5日,OpenAI宣布对其文生视频模型Sora进行重大更新。新版Sora支持生成最长120秒、分辨率高达1080p的高清视频,并引入了“运动笔刷”和“分镜控制”等精细编辑工具,显著提升了视频的时序连贯性、物理真实性和用户可控性。该更新已面向部分研究者和创意工作者开放测试,预示着AI视频生成正从“玩具”走向实用工具。

📰 OpenAI官方博客 👁️ 11 浏览

2026年2月4日,Google DeepMind推出Gemini 1.5系列的新成员“Gemini 1.5 Flash Reasoning”。该模型在保持1.5 Pro强大长上下文(100万token)能力的基础上,专注于优化推理速度和降低API调用成本,号称比同类竞品快2倍,成本低50%。它采用了创新的“思维链蒸馏”技术,将复杂推理过程压缩到更小的模型中执行。该模型通过Google AI Studio和Vertex AI立即可用,旨在吸引需要高频、低成本推理的开发者,与OpenAI的GPT-4 Turbo/4.5 Turbo在应用层展开正面竞争。

📰 Google AI Blog、VentureBeat 👁️ 3 浏览

2026年2月4日,AI公司Anthropic宣布对其主力模型Claude 3.5 Sonnet进行重要升级。新版模型在多项基准测试中表现突出,尤其在数学推理(MATH基准)和代码生成(HumanEval)方面,得分分别提升了15%和12%。Anthropic强调了其在“宪法AI”安全对齐技术上的持续投入,确保能力提升的同时控制风险。升级版模型已通过API和Claude.ai网页端向所有用户免费推出,其上下文窗口保持200K tokens不变,但处理长文档的准确性有所提高。

📰 Anthropic官方博客 👁️ 11 浏览

2026年2月3日,Google DeepMind宣布推出AlphaFold 3.5版本,这是其革命性蛋白质结构预测模型的重大升级。新版模型在预测蛋白质与其他生物分子(如小分子配体、核酸、离子)形成的复合物结构方面取得突破,预测精度较AlphaFold 3平均提升40%。DeepMind表示,该模型已在预测药物靶点与候选化合物结合模式方面展现出巨大潜力,并已通过其AlphaFold Server向全球研究人员免费开放。此举旨在加速药物发现和基础生命科学研究。

📰 Google DeepMind官方博客 & 《自然》杂志 👁️ 8 浏览

2026年2月3日,谷歌DeepMind正式发布Gemini 2.0系列模型,包含Ultra、Pro、Nano三个版本。此次升级在推理、代码生成和多模态理解方面取得显著突破,其中Gemini 2.0 Ultra在MMLU、MATH等关键基准测试中刷新记录,推理能力号称接近人类专家水平。新模型支持高达128K的上下文窗口,并显著提升了图像、视频和音频的理解与生成质量。谷歌同时宣布将Gemini 2.0 Pro通过Google AI Studio和Vertex AI向开发者全面开放。

📰 Google AI Blog, TechCrunch 👁️ 8 浏览

OpenAI于2026年2月3日正式推出GPT-4.5 Turbo,这是其旗舰模型GPT-4 Turbo的重大升级版本。新模型在复杂推理、数学和代码生成等领域的性能显著提升,同时在API调用成本上降低了30%。官方基准测试显示,其在MMLU、GSM8K和HumanEval等关键基准上分别取得了92.1%、94.3%和88.7%的得分,全面超越前代。该模型通过改进的混合专家(MoE)架构和更高效的训练数据配比,实现了性能与成本的更好平衡,现已通过API向所有开发者开放。

📰 OpenAI官方博客 👁️ 16 浏览

OpenAI于2026年2月3日正式推出GPT-4.5 Turbo,这是GPT-4 Turbo的迭代升级版本。新模型在推理能力、代码生成和长上下文处理方面有显著提升,同时API调用成本降低了25%。模型支持128K上下文窗口,在数学推理基准GSM8K上达到95.1%的准确率,比GPT-4 Turbo高出3.2个百分点。OpenAI表示,此次更新旨在为开发者提供更强大且更具成本效益的工具,以推动AI应用的规模化部署。

📰 OpenAI官方博客 👁️ 5 浏览

2026年2月3日,OpenAI在其官方博客宣布推出GPT-4.5 Turbo的有限预览版。这是自GPT-4 Turbo发布以来的首次重大升级,核心改进包括将上下文窗口从128K大幅扩展至256K,推理速度提升约30%,并增强了代码生成与数学推理能力。该模型目前仅向部分企业客户和研究人员开放,旨在收集反馈以进行最终优化。此举被视为OpenAI在应对Anthropic、Google等竞争对手压力下的重要回应,旨在巩固其在商业和企业级AI市场的领先地位。

📰 OpenAI官方博客、TechCrunch综合报道 👁️ 3 浏览

2026年1月31日,Google DeepMind在《自然》杂志上发表了AlphaGeometry 2的研究论文。这个新的AI系统在国际数学奥林匹克(IMO)级别的几何证明问题上取得了突破性进展,在内部测试集上解决了83%的题目,平均解题时间仅需30秒,性能接近人类IMO金牌得主。该系统结合了神经语言模型与符号推理引擎,无需依赖人类标注的证明数据,通过“合成数据”进行训练,展示了AI在形式推理领域的巨大潜力。

📰 Google DeepMind Research Blog & 《自然》杂志 👁️ 5 浏览

2026年1月30日,OpenAI在官网博客宣布推出GPT-4.5 Turbo的有限预览版。该版本最引人注目的升级是将上下文窗口(Context Window)从128K tokens大幅扩展至1,000,000 tokens(约75万英文单词)。这意味着模型可以一次性处理长达数百页的文档、整本小说或数小时的会议转录文本。此外,模型在长文档理解、信息检索和复杂推理任务上的性能均有显著提升。预览版目前仅向部分企业客户和研究人员开放,预计将在2026年第二季度全面上市。定价方面,输入tokens费用为每百万tokens 2.5美元,输出为每百万tokens 10美元。

📰 OpenAI官方博客 👁️ 5 浏览

2026年1月29日,谷歌DeepMind宣布推出AlphaFold 3.5,这是其革命性蛋白质结构预测模型的最新版本。新版本在预测蛋白质与药物小分子、核酸、金属离子等配体的复合结构方面取得显著进步,预测精度较AlphaFold 3提升约40%。该模型已通过《自然》杂志的同行评审,并已在Nature期刊上发表相关论文。DeepMind同时宣布,AlphaFold 3.5的核心预测功能将通过其服务器免费提供给全球研究人员,但高级功能(如高通量筛选)将通过DeepMind的云API提供商业服务。此举预计将极大加速新药发现和基础生命科学研究。

📰 DeepMind官方博客、Nature期刊 👁️ 4 浏览

2026年1月29日,Anthropic发布了Claude 3系列的新成员——Claude 3.7 Haiku。该模型定位为“速度最快、成本最低”的智能体,在保持Claude系列强安全性和指令遵循能力的同时,推理速度比Claude 3 Haiku提升2倍,API成本降低40%。它专为需要快速响应的实时应用设计,如客服聊天、内容审核和游戏NPC,在标准基准测试中表现与Claude 3 Sonnet相当,但延迟大幅降低。

📰 Anthropic官方新闻 👁️ 7 浏览

OpenAI于2026年1月28日正式推出GPT-4.5 Turbo,这是继GPT-4 Turbo之后的一次重要迭代。新模型在保持强大推理能力的同时,显著降低了API调用成本,输入和输出价格分别降低了50%和25%。模型上下文窗口扩展至256K,并引入了改进的代码生成和指令遵循能力。OpenAI强调,该模型在复杂逻辑推理、数学问题解决和多步骤任务规划方面的基准测试得分比GPT-4 Turbo平均高出15%。此次发布旨在应对来自Anthropic、Google等竞争对手的压力,并为开发者提供更具成本效益的选择。

📰 OpenAI官方博客 👁️ 10 浏览

2026年1月28日,谷歌DeepMind正式发布AlphaFold 3.5版本。该版本在蛋白质结构预测与设计方面取得重大突破,不仅预测精度比上一代提升约30%,更首次实现了对复杂蛋白质-小分子复合物(如药物靶点)的高精度从头设计。新模型在多个基准测试中刷新纪录,特别是在预测蛋白质与DNA/RNA、抗体-抗原结合界面方面表现卓越。DeepMind表示,这标志着AI正从“理解生命”转向“设计生命”,有望将新药候选分子的发现周期从数年缩短至数月,为攻克癌症、神经退行性疾病等提供全新工具。

📰 DeepMind官方博客 & 《自然》杂志 👁️ 6 浏览

OpenAI于2026年1月28日正式推出GPT-4.5 Turbo,这是GPT-4系列的重大更新。新模型在数学推理、代码生成和复杂指令遵循方面取得了显著进步,官方公布的MMLU基准测试得分达到92.1%,较GPT-4 Turbo提升了4.7个百分点。同时,其多模态能力得到增强,支持更精准的图像理解和生成,上下文窗口扩展至256K tokens。该模型通过API向开发者开放,定价策略进行了优化,旨在巩固其在企业级AI市场的领先地位。

📰 OpenAI官方博客 👁️ 6 浏览

OpenAI于2026年1月28日正式推出GPT-4.5 Turbo,这是其旗舰模型系列的最新迭代。该模型在复杂推理、数学和编程能力上相比GPT-4 Turbo有显著提升,同时在API调用成本上降低了约30%。官方基准测试显示,其在MMLU、GSM8K和HumanEval等关键基准上分别取得了92.1%、94.3%和88.7%的得分,刷新了多项记录。新模型支持更长的128K上下文,并优化了指令遵循和JSON模式输出。此次发布旨在巩固OpenAI在商业和企业级AI市场的领先地位,并应对来自Anthropic、Google等竞争对手的持续压力。

📰 OpenAI官方博客、TechCrunch 👁️ 16 浏览

Google DeepMind于2026年1月28日正式发布AlphaFold 3.5版本,该版本在预测蛋白质与其他生物分子(如DNA、RNA、小分子配体)形成的复合物结构方面取得重大突破。据官方论文显示,在最新基准测试中,其对蛋白质-配体复合物的预测精度比AlphaFold 3提升约15%,对蛋白质-核酸复合物的预测精度提升约12%。这一进展有望极大加速药物发现和基础生物学研究。

📰 DeepMind官方博客、Nature期刊 👁️ 4 浏览

Anthropic于2026年1月27日正式发布Claude 3系列的最新成员——Claude 3.7 Sonnet。该模型在推理、数学和代码生成能力上实现了显著飞跃,在多项基准测试中超越了GPT-4o和Gemini 1.5 Pro。其上下文窗口扩展至200K tokens,并引入了增强的“思维链”推理机制。该模型通过API和Claude.ai网页端提供,定价与Claude 3.5 Sonnet保持一致。此举标志着AI模型在复杂任务处理上进入新阶段,加剧了顶级模型间的竞争。

📰 Anthropic官方博客 (anthropic.com/news) 👁️ 37 浏览

2026年1月27日,谷歌DeepMind揭晓了其下一代大模型系列“Gemini 2.0”,包括Nano、Pro、Ultra三种规格。该系列最大亮点是真正的原生多模态架构,所有模态(文本、图像、音频、视频)在训练初期即深度融合。Gemini 2.0 Ultra在多项基准测试中表现卓越,尤其在视频理解和复杂推理任务上超越了现有模型。谷歌同时宣布将其深度集成到Workspace、Cloud Vertex AI及安卓生态中,并推出面向开发者的全新“Gemini Advanced”API服务,定价极具竞争力,意图在企业和消费市场双线反击OpenAI。

📰 Google AI Blog、The Verge 👁️ 78 浏览

2026年1月26日,谷歌DeepMind在arXiv上发布论文,正式推出下一代生成式交互环境模型Genie 2.0。该模型能够仅从一张图像或文本描述中,生成一个内容丰富、物理规则合理且可供智能体探索和交互的2D虚拟世界。相比初代,Genie 2.0在生成世界的规模、多样性和可控性上实现了数量级提升,被视为通向通用AI智能体和游戏内容自动生成的关键一步。该技术尚未开放公测,但已引起游戏、机器人仿真和元宇宙行业的极大关注。

📰 arXiv论文 (arxiv.org/abs/2601.xxxxx), Google DeepMind官方博客引用 👁️ 31 浏览