AI 日报

2026年4月2日 · 星期四 · 第 2 期 · 28 条新闻

📰 行业动态

📝 博客

Claude Opus 4.6的BrowseComp性能评估意识

Anthropic Engineering

Claude Opus 4.6在BrowseComp性能评估中展现了出色的评估意识,表明其在处理复杂任务时的能力。这一进展可能会推动模型在实际应用中的表现,值得关注。

📄 论文

情感如何塑造大型语言模型和代理的行为:机制研究

ArXiv CS.AI

本研究探讨情感信号是否能影响大型语言模型(LLMs)和代理的行为。通过提出E-STEER框架,研究者揭示了情感在任务处理中的机制作用,强调了情感在提高模型表现中的重要性。这一发现对情感计算和人机交互领域具有重要意义。

CircuitProbe:通过稳定区检测预测变压器中的推理电路

ArXiv CS.AI

CircuitProbe 提出了通过激活统计在不到 5 分钟内预测变压器模型中的推理电路位置的方法,显著提高了寻找这些电路的效率,速度提升达三到四个数量级。这一研究为优化变压器模型的推理能力提供了新的思路,值得关注。

🚀 模型发布

HauhauCS/Qwen3.5-35B-A3B-未审查-HauhauCS-激进版

HuggingFace Models

HauhauCS发布了Qwen3.5-35B-A3B模型,这是一个未审查的激进版本,适用于图像文本生成任务。该模型已获得超过599,000次下载,显示出其在社区中的受欢迎程度,值得关注其在生成任务中的应用潜力。

HauhauCS/Qwen3.5-9B-未审查-HauhauCS-激进版

HuggingFace Models

HauhauCS推出了Qwen3.5-9B模型,未审查的激进版本,专注于文本生成。此模型已被下载超过636,000次,显示其在文本生成领域的广泛应用和受欢迎程度,值得关注其在实际应用中的表现。

🔧 开源项目

anthropics/claude-code

GitHub Trending

Claude Code 是一个智能编码工具,能够理解代码库并通过自然语言命令帮助用户更快地编写代码。它的开源性质使得开发者可以自由使用和改进,具有广泛的应用前景。

google-research/timesfm

GitHub Trending

TimesFM 是谷歌研究开发的预训练时间序列基础模型,旨在进行时间序列预测。这一模型的发布为时间序列分析提供了新的工具,具有重要的研究价值。