AI 日报 - 2026-04-23

📰 行业动态

我们的第八代TPU：为代理时代设计的两款芯片

Hacker News

谷歌在Google Cloud Next大会上推出了第八代定制的Tensor处理单元（TPU），包括TPU 8t和TPU 8i两种架构，分别用于训练和推理。这些芯片旨在支持谷歌自建的超级计算机，推动从前沿模型训练到大规模推理工作负载的各类应用。TPU 8t和TPU 8i是与Google DeepMind合作设计的，能够应对最苛刻的AI工作负载，并适应不断演变的模型架构。TPU的设计标准包括定制数值、液体冷却和定制互连等，经过十多年的发展，第八代TPU在能效和性能上实现了显著提升。这一代TPU的推出标志着AI基础设施的又一次重大进步，为行业和开发者提供了更强大的计算能力。

📝 博客

改进 ChatGPT 以更好地服务临床医生

OpenAI Blog

OpenAI 宣布为美国经过验证的医生、护士和药剂师免费提供 ChatGPT，以支持临床护理、文档编写和研究。这一举措旨在通过提供一个强大的语言模型工具，帮助医疗专业人员更高效地处理日常任务和复杂的医学问题。ChatGPT 的应用不仅限于简单的问答，还可以协助生成医疗文档、分析研究数据和提供决策支持。这种免费提供的策略可能会加速 AI 在医疗领域的普及，提高医疗服务的效率和准确性。

在 ChatGPT 中引入工作空间代理

OpenAI Blog

OpenAI 推出了由 Codex 驱动的 ChatGPT 工作空间代理，这些代理可以在云端自动化复杂的工作流程，帮助团队在各种工具之间安全地扩展工作。这些代理旨在简化团队操作，通过自动化重复性任务和连接不同的工具，提升工作效率。此功能的推出标志着 AI 在企业工作流程中的应用进一步深化，可能会显著提高团队协作效率和生产力。

通过 Responses API 中的 WebSockets 加速代理工作流

OpenAI Blog

OpenAI 详细介绍了如何通过在 Responses API 中使用 WebSockets 和连接范围缓存来减少 API 开销并提高模型延迟。此方法显著加快了代理工作流的速度，优化了模型的响应时间。通过这种技术，开发者可以在不增加硬件资源的情况下提高系统性能，从而为用户提供更流畅的体验。这一进展可能会在需要实时响应的应用中带来显著的性能提升。

📄 论文

ARES：自适应红队和端到端修复策略-奖励系统

ArXiv CS.AI

本文介绍了ARES框架，用于识别和修复大型语言模型（LLM）和奖励模型（RM）同时失效的系统性弱点。ARES通过“安全导师”生成对抗性提示，揭示LLM和RM的双重弱点，并通过两阶段修复过程增强模型的安全性。实验表明，ARES在多个对抗性安全基准上显著提高了安全鲁棒性，同时保持了模型能力。这一框架为全面的RLHF安全对齐设立了新范式，对开发者而言，意味着更安全的AI模型开发。

面向可扩展的终身知识编辑：选择性知识抑制

ArXiv CS.AI

大型语言模型（LLMs）需要频繁更新知识以反映不断变化的事实并减少幻觉现象。现有的参数编辑方法在连续编辑过程中稳定性较差，容易导致灾难性遗忘。为了解决这些问题并提高终身设置中的可扩展性，研究者提出了LightEdit框架。该框架首先从检索的信息中选择相关知识以有效修改查询，然后通过解码策略抑制模型的原始知识概率，从而实现基于选定信息的高效编辑。在ZSRE、Counterfact和RIPE基准测试中的广泛实验表明，LightEdit优于现有的终身知识编辑方法，并通过最小化训练成本实现了成本效益高的可扩展性，能够轻松适应各种数据集。

🚀 模型发布

Qwen3.6-35B-A3B

HuggingFace Models

Qwen3.6-35B-A3B是一个在Hugging Face Transformers格式下发布的后训练模型，具有35B参数和3B激活参数。该模型专注于稳定性和实际应用，提供更直观和高效的编码体验。其主要升级包括更流畅的前端工作流处理和库级推理能力，以及保留历史消息推理上下文的新选项，简化迭代开发并减少开销。模型支持长达1,010,000个token的上下文长度，适用于多种AI框架。此版本的发布为开发者提供了更强大的工具来提高生产力。

ChatGPT 图像 2.0

Hacker News

OpenAI发布了ChatGPT的图像生成2.0版本，进一步提升了AI在图像生成领域的能力。新版本在图像质量、生成速度和多样性上都有显著提升，支持更复杂的场景和更高分辨率的输出。这一更新不仅增强了AI在创意设计和内容生成中的应用潜力，还为用户提供了更广泛的创作空间。随着AI技术的不断进步，图像生成工具在广告、媒体和娱乐等行业的应用前景更加广阔。

🔄 工具更新

OpenClaw 2026.4.20-beta.1 发布

OpenClaw Updates

OpenClaw 发布了 2026.4.20-beta.1 版本，带来了多项重要更新。首先，用户界面方面，设置向导的安全免责声明进行了重新设计，增加了黄色警告标志和加载动画，以提升用户体验。在代理和提示功能上，系统提示和 OpenAI GPT-5 叠加层得到了增强，增加了实时状态检查和弱结果恢复功能。在模型和成本管理方面，支持分级模型定价，并提供 Moonshot Kimi K2.6/K2.5 的成本估算。此外，会议和维护功能现在默认强制执行内置条目上限和年龄修剪，防止过多的会话积压导致内存溢出。插件和测试方面，优化了插件加载别名和配置解析，减少了测试开销。Cron 作业管理进行了改进，分离了运行时执行状态以保持作业定义的稳定性。最后，Moonshot/Kimi 模型默认设置为 Kimi K2.6，提供了更好的兼容性和功能支持。这些更新将显著提升 OpenClaw 的性能和用户体验。

🔧 开源项目

zilliztech/claude-context

GitHub Trending

Claude Context是一个MCP插件，为Claude Code和其他AI编码代理提供语义代码搜索功能。它通过语义搜索从数百万行代码中找到相关代码，将结果直接引入Claude的上下文中，而无需多轮发现。该插件通过将代码库存储在矢量数据库中，仅在上下文中使用相关代码，从而降低了大规模代码库的成本。Claude Context支持与Claude Code等AI编码助手的集成，为开发者提供了高效的代码搜索和上下文管理工具。

📰 行业动态

📝 博客

📄 论文

🚀 模型发布

🔄 工具更新

🔧 开源项目

🔥 全网热榜

微博热搜

知乎热榜

今日头条