AI 日报

2026年4月23日 · 星期四 · 第 23 期 · 28 条新闻

📰 行业动态

我们的第八代TPU:为代理时代设计的两款芯片

Hacker News

谷歌在Google Cloud Next大会上推出了第八代定制的Tensor处理单元(TPU),包括TPU 8t和TPU 8i两种架构,分别用于训练和推理。这些芯片旨在支持谷歌自建的超级计算机,推动从前沿模型训练到大规模推理工作负载的各类应用。TPU 8t和TPU 8i是与Google DeepMind合作设计的,能够应对最苛刻的AI工作负载,并适应不断演变的模型架构。TPU的设计标准包括定制数值、液体冷却和定制互连等,经过十多年的发展,第八代TPU在能效和性能上实现了显著提升。这一代TPU的推出标志着AI基础设施的又一次重大进步,为行业和开发者提供了更强大的计算能力。

📝 博客

改进 ChatGPT 以更好地服务临床医生

OpenAI Blog

OpenAI 宣布为美国经过验证的医生、护士和药剂师免费提供 ChatGPT,以支持临床护理、文档编写和研究。这一举措旨在通过提供一个强大的语言模型工具,帮助医疗专业人员更高效地处理日常任务和复杂的医学问题。ChatGPT 的应用不仅限于简单的问答,还可以协助生成医疗文档、分析研究数据和提供决策支持。这种免费提供的策略可能会加速 AI 在医疗领域的普及,提高医疗服务的效率和准确性。

在 ChatGPT 中引入工作空间代理

OpenAI Blog

OpenAI 推出了由 Codex 驱动的 ChatGPT 工作空间代理,这些代理可以在云端自动化复杂的工作流程,帮助团队在各种工具之间安全地扩展工作。这些代理旨在简化团队操作,通过自动化重复性任务和连接不同的工具,提升工作效率。此功能的推出标志着 AI 在企业工作流程中的应用进一步深化,可能会显著提高团队协作效率和生产力。

通过 Responses API 中的 WebSockets 加速代理工作流

OpenAI Blog

OpenAI 详细介绍了如何通过在 Responses API 中使用 WebSockets 和连接范围缓存来减少 API 开销并提高模型延迟。此方法显著加快了代理工作流的速度,优化了模型的响应时间。通过这种技术,开发者可以在不增加硬件资源的情况下提高系统性能,从而为用户提供更流畅的体验。这一进展可能会在需要实时响应的应用中带来显著的性能提升。

📄 论文

ARES:自适应红队和端到端修复策略-奖励系统

ArXiv CS.AI

本文介绍了ARES框架,用于识别和修复大型语言模型(LLM)和奖励模型(RM)同时失效的系统性弱点。ARES通过“安全导师”生成对抗性提示,揭示LLM和RM的双重弱点,并通过两阶段修复过程增强模型的安全性。实验表明,ARES在多个对抗性安全基准上显著提高了安全鲁棒性,同时保持了模型能力。这一框架为全面的RLHF安全对齐设立了新范式,对开发者而言,意味着更安全的AI模型开发。

面向可扩展的终身知识编辑:选择性知识抑制

ArXiv CS.AI

大型语言模型(LLMs)需要频繁更新知识以反映不断变化的事实并减少幻觉现象。现有的参数编辑方法在连续编辑过程中稳定性较差,容易导致灾难性遗忘。为了解决这些问题并提高终身设置中的可扩展性,研究者提出了LightEdit框架。该框架首先从检索的信息中选择相关知识以有效修改查询,然后通过解码策略抑制模型的原始知识概率,从而实现基于选定信息的高效编辑。在ZSRE、Counterfact和RIPE基准测试中的广泛实验表明,LightEdit优于现有的终身知识编辑方法,并通过最小化训练成本实现了成本效益高的可扩展性,能够轻松适应各种数据集。

🚀 模型发布

Qwen3.6-35B-A3B

HuggingFace Models

Qwen3.6-35B-A3B是一个在Hugging Face Transformers格式下发布的后训练模型,具有35B参数和3B激活参数。该模型专注于稳定性和实际应用,提供更直观和高效的编码体验。其主要升级包括更流畅的前端工作流处理和库级推理能力,以及保留历史消息推理上下文的新选项,简化迭代开发并减少开销。模型支持长达1,010,000个token的上下文长度,适用于多种AI框架。此版本的发布为开发者提供了更强大的工具来提高生产力。

ChatGPT 图像 2.0

Hacker News

OpenAI发布了ChatGPT的图像生成2.0版本,进一步提升了AI在图像生成领域的能力。新版本在图像质量、生成速度和多样性上都有显著提升,支持更复杂的场景和更高分辨率的输出。这一更新不仅增强了AI在创意设计和内容生成中的应用潜力,还为用户提供了更广泛的创作空间。随着AI技术的不断进步,图像生成工具在广告、媒体和娱乐等行业的应用前景更加广阔。

🔄 工具更新

OpenClaw 2026.4.20-beta.1 发布

OpenClaw Updates

OpenClaw 发布了 2026.4.20-beta.1 版本,带来了多项重要更新。首先,用户界面方面,设置向导的安全免责声明进行了重新设计,增加了黄色警告标志和加载动画,以提升用户体验。在代理和提示功能上,系统提示和 OpenAI GPT-5 叠加层得到了增强,增加了实时状态检查和弱结果恢复功能。在模型和成本管理方面,支持分级模型定价,并提供 Moonshot Kimi K2.6/K2.5 的成本估算。此外,会议和维护功能现在默认强制执行内置条目上限和年龄修剪,防止过多的会话积压导致内存溢出。插件和测试方面,优化了插件加载别名和配置解析,减少了测试开销。Cron 作业管理进行了改进,分离了运行时执行状态以保持作业定义的稳定性。最后,Moonshot/Kimi 模型默认设置为 Kimi K2.6,提供了更好的兼容性和功能支持。这些更新将显著提升 OpenClaw 的性能和用户体验。

🔧 开源项目

zilliztech/claude-context

GitHub Trending

Claude Context是一个MCP插件,为Claude Code和其他AI编码代理提供语义代码搜索功能。它通过语义搜索从数百万行代码中找到相关代码,将结果直接引入Claude的上下文中,而无需多轮发现。该插件通过将代码库存储在矢量数据库中,仅在上下文中使用相关代码,从而降低了大规模代码库的成本。Claude Context支持与Claude Code等AI编码助手的集成,为开发者提供了高效的代码搜索和上下文管理工具。