AI 每日热点 - 2026-05-26

Claude AI 分析

今日洞察

AI 行业日报 · 2026-05-26

今日速览

今天最引人注目的信号是 AI 主动发现真实内核漏洞：HN 热榜报道了 CVE-2026-28952，由 Claude 独立挖掘出 Apple macOS 26.5 的内核安全漏洞，这标志着 AI 辅助安全研究进入新阶段。与此同时，Anthropic 将官方插件仓库重命名为 knowledge-work-plugins，定位从"通用插件"收窄为"知识工作者专属"，生态策略更加聚焦。论文层面今日全部为新作，Agentic AI 的可解释性、自我进化与能耗核算构成三条平行主线，学界对 Agent 系统的治理与可靠性关注明显升温。微软 Copilot Cowork 文件外泄漏洞同日曝光，"AI 工具既发现漏洞，也制造漏洞"的矛盾格局在同一天同时呈现。

重点项目点评

1. `affaan-m/ECC` ⭐ 新 · +2,025 stars

面向 AI 编程 Agent 的性能优化框架，将 Agent 能力拆解为技能（Skill）、本能（Instinct）、记忆（Memory）与安全（Safety）四个模块。当前市场上大多数 Agent 框架还在解决"能不能用"的问题，ECC 直接切入"用得好不好"的性能工程层，分类框架有较强的工程实用性。首日破 2K stars 说明市场对 Agent 调优工具存在真实需求，值得跟进其后续落地案例。

2. `anthropics/knowledge-work-plugins` · +1,441 stars

相比此前的 claude-plugins-official，今日的 knowledge-work-plugins 命名透露了 Anthropic 的策略转变——将插件生态锚定在"知识工作者"这一高价值场景，而非泛化的"官方插件集"。这与 GitHub Copilot、Notion AI 等竞品的垂直化路径一致，意味着 Claude 的商业化重心正从 API 消费者向企业知识工作者转移，对 B2B SaaS 赛道有示范效应。

3. CVE-2026-28952：Claude 发现 macOS 内核漏洞（HN #3）

这是今天最值得记录的历史性节点之一。Claude 独立发现了 Apple macOS 26.5 的内核级安全漏洞并获得正式 CVE 编号，意味着 AI 已能在无人工引导下完成从代码审计到漏洞归纳的完整链路。与此同时，Microsoft Copilot Cowork 同日被曝文件外泄漏洞（HN #1，score 189），两条新闻并列呈现了 AI 安全的双面性：AI 既是最有效的漏洞猎手，也是新的攻击面。

4. EVE-Agent：Evidence-Verifiable Self-Evolving Agents · 新论文

"可验证证据驱动的自进化 Agent"这一命题直指当前 Agent 系统最核心的可信度问题——Agent 进化的每一步能否被审计？。与 SOLAR（上周讨论过的终身学习 Agent）相比，EVE-Agent 更强调进化过程的可解释性与证据链留存，这在监管合规场景（金融、医疗、法律）中具有特殊价值，是目前 Self-Evolving Agent 研究中少见的治理导向工作。

5. BOHM：零成本层次化归因（Compound AI Systems）· 新论文

"Zero-Cost Hierarchical Attribution"——为复合 AI 系统（多模型、多工具链）提供零额外开销的贡献归因方法。随着 RAG、Tool-use、Multi-Agent 管线越来越复杂，"这个输出结果是哪个模块导致的"成为调试和责任界定的关键问题。BOHM 若能真正做到零成本，对工业界落地 Explainable AI 将有重要推动作用。

趋势洞察

方向一：AI Agent 基础设施的"垂直化"分工

连续多天的 codegraph（代码知识图谱）、今日新出的 ECC（Agent 性能框架）、cmux（Agent 专用终端），以及 Understand-Anything（代码转知识图谱）共同指向同一趋势：围绕 AI 编程 Agent 的基础设施正在快速垂直分工，从 IDE 插件演变为独立的工具链生态。每个节点解决一个专项问题（减少 token、优化行为、管理上下文），合力构成 Agent-Native 的开发栈。

方向二：AI 安全进入"攻守同体"新格局

今天两条安全新闻构成鲜明对比：Claude 发现 macOS 内核漏洞（AI 作为防御工具的顶峰体现）vs Copilot 文件外泄漏洞（AI 平台自身成为攻击面）。这预示着 AI 安全研究将分化为两个子领域：用 AI 做漏洞挖掘（Red-Teaming-as-a-Service）和审计 AI 系统本身的安全性。两者都将成为未来 2-3 年的高需求方向。mukul975/Anthropic-Cybersecurity-Skills 连续 3 天上榜，印证了市场对系统化 AI 安全工具的强烈需求。

方向三：科学研究自动化的知识图谱底座

今日论文中 SciAtlas（科学研究大型知识图谱）和 RMA（研究级数学问题 Agentic 系统）同时出现，加上 GitHub 上持续活跃的 Understand-Anything，"知识图谱 + Agent"正成为科研自动化的标准架构。知识图谱解决结构化知识存储与检索，Agent 负责多步推理与行动，二者结合比纯 LLM 在专业领域的可靠性显著更高。ImProver 2（神经符号证明优化）进一步将这一趋势延伸到形式化推理领域。

值得跟进

项目 / 论文	理由
CVE-2026-28952 原始报告	AI 主动发现内核漏洞的首批案例，具有历史意义，值得跟踪完整技术披露
EVE-Agent 论文	自进化 Agent + 可审计证据链，监管合规场景的稀缺研究方向
BOHM 论文	复合 AI 系统零成本归因，调试与可解释性工程的潜在利器
affaan-m/ECC	Agent 性能工程框架，关注其 benchmark 数据与实际案例是否扎实
RMA（数学推理 Agent）	研究级数学能力是当前 LLM 边界测试的重要前沿，可跟踪其方法论能否泛化到其他推理密集型任务

社区动态补注：Reddit 上关于 METR AI 时间跨度图表存在"大量严重错误"的讨论值得关注——METR 的研究被广泛引用于 AI 能力评估，若方法论存疑，相关政策讨论的基础需要重新审视。

💻 GitHub 热门 AI 项目

1 Lum1104/Understand-Anything

将任意代码转化为可交互知识图谱，支持探索、搜索和自然语言问答

让代码理解从静态阅读变为动态探索，适配 Claude Code、Cursor 等主流 AI 编程工具

连续5天 +5,604 today TypeScript

2 anthropics/knowledge-work-plugins

Anthropic 官方开源的知识工作者专用 Claude 插件合集

官方出品，直接扩展 Claude 在知识工作场景的能力边界，权威性与可信度高

+1,441 today Python

3 rohitg00/ai-engineering-from-scratch

从零系统学习 AI 工程，覆盖学习、构建到上线交付的完整路径

结构化 AI 工程入门体系，适合想从头掌握 AI 开发全流程的工程师

连续6天 +3,154 today Python

4 affaan-m/ECC

面向 AI 编程 Agent 的性能优化框架，涵盖技能、本能、记忆与安全模块

系统化提升 AI Agent 编程效能，兼容 Claude Code、Codex、Cursor 等多个主流平台

NEW +2,025 today JavaScript

5 mukul975/Anthropic-Cybersecurity-Skills

754 个结构化网络安全技能，映射至 MITRE ATT&CK 等五大安全框架

将主流安全框架整合为 AI Agent 可用的技能集，攻防两侧全覆盖，适合安全从业者

连续3天 +1,004 today Python

6 colbymchenry/codegraph

预索引的本地代码知识图谱，减少 Token 消耗和 AI 工具调用次数

100% 本地运行，显著降低 AI 编程上下文开销，对大型代码库提效明显

连续9天 +3,161 today TypeScript

7 manaflow-ai/cmux

基于 Ghostty 的 macOS 终端，专为 AI 编程 Agent 设计竖向标签与通知机制

专为 AI 编程工作流打造的终端工具，改善多 Agent 并行时的操控与感知体验

+603 today Swift

8 multica-ai/andrej-karpathy-skills

源自 Karpathy 观察的单文件 CLAUDE.md，针对性改善 Claude Code 编码行为

大神实战经验提炼为一个配置文件，低成本规避常见 LLM 编码陷阱

连续6天 +2,749 today

9 anthropics/claude-cookbooks

Anthropic 官方 Claude 使用案例集，含多种实用且有趣的 Notebook 示例

官方出品的最佳实践食谱，快速掌握 Claude API 各类高阶用法的首选参考

NEW +141 today Jupyter Notebook

10 Leonxlnx/taste-skill

为 AI 注入审美品味，防止生成千篇一律的平庸内容

直击 AI 生成内容同质化痛点，通过技能文件让输出更具个性和设计感

NEW +264 today Shell

11 moeru-ai/airi

可自托管的 AI 虚拟伴侣，支持实时语音聊天、Minecraft 等多场景互动

深度融合 AI 角色扮演与实时互动，对标 Neuro-sama，探索虚拟存在的边界

NEW +62 today TypeScript

12 hardikpandya/stop-slop

专用技能文件，消除 AI 写作中的典型痕迹，使文本更自然流畅

精准解决 AI 生成文本的「味道」问题，一个文件即可显著提升内容真实感

NEW +345 today

13 garrytan/gstack

复刻 Garry Tan 的 Claude Code 配置，23 个工具覆盖 CEO 到 QA 全团队角色

YC 总裁亲测的实战配置，将 Claude 化身全栈虚拟团队，参考价值极高

+640 today TypeScript

🤗 HuggingFace 热门

模型

1 tencent/Hy-MT2-1.8B

腾讯混元MT2系列1.8B参数轻量语言模型，适合端侧部署与高效推理

连续4天 translation 5,552 下载 822 赞

2 bytedance-research/Lance

字节跳动研究院发布的大语言模型，面向推理与指令跟随任务优化。

连续7天 any-to-any 1,679 下载 819 赞

3 NemoStation/Marlin-2B

NemoStation发布的2B参数小型语言模型，定位轻量级对话与文本生成任务

连续5天 video-text-to-text 7,291 下载 348 赞

4 tencent/Hy-MT2-30B-A3B

腾讯混元MT2系列30B总参数MoE大模型，激活参数仅3B，兼顾性能与效率

连续4天 translation 1,494 下载 327 赞

5 sapientinc/HRM-Text-1B

Sapient Intelligence开发的10亿参数语言模型，采用双时间尺度分层推理架构（HRM），支持推理与NLP任务，未经指令微调。

连续6天 text-generation 90,026 下载 316 赞

6 Supertone/supertonic-3

连续14天 text-to-speech 45,800 下载 675 赞

7 meituan-longcat/LongCat-Video-Avatar-1.5

NEW 0 下载 230 赞

8 SulphurAI/Sulphur-2-base

连续22天 text-to-video 1,354,786 下载 1352 赞

9 CohereLabs/command-a-plus-05-2026-w4a4

连续3天 image-text-to-text 7,449 下载 200 赞

10 unsloth/Qwen3.6-27B-MTP-GGUF

连续12天 image-text-to-text 695,277 下载 480 赞

数据集

1 angrygiraffe/claude-opus-4.6-4.7-reasoning-8.7k

包含约8700条Claude Opus 4.6/4.7推理链的微调数据集，用于蒸馏或增强模型思维链能力。

连续20天 5,162 下载 233 赞

2 GD-ML/TransitLM

面向交通与公共出行领域的专用语言模型，针对行程规划等场景微调

连续4天 1,007 下载 77 赞

3 wikimedia/structured-wikipedia

Wikimedia发布的结构化Wikipedia数据集，含多语言百科文章及段落、标题等结构化字段，适用于问答和知识抽取任务。

连续4天 3,250 下载 167 赞

4 TuringEnterprises/Open-MM-RL

图灵企业发布的开源多模态强化学习数据集，用于提升视觉语言模型的推理与对齐能力

连续14天 13,469 下载 212 赞

5 AlienKevin/SWE-ZERO-12M-trajectories

软件工程代理轨迹数据集，含1200万条零样本代码修复与任务执行轨迹，用于训练SWE智能体。

连续12天 11,979 下载 108 赞

6 actava/chi-bench

连续5天 1,862 下载 41 赞

7 TeichAI/DeepSeek-v4-Pro-Agent

连续9天 3,273 下载 63 赞

8 armand0e/qwen3.7-max-pi-traces

NEW 378 下载 32 赞

9 PsiBotAI/SynData

连续11天 173,205 下载 174 赞

10 zhifeixie/Voices-in-the-Wild-2M

7,891 下载 24 赞

热门论文

1 Pantheon360：通过3D感知的360°视频扩散驯服数字孪生生成

Pantheon360: Taming Digital Twin Generation via 3D-Aware 360° Video Diffusion

Pantheon360结合3D感知扩散模型与显式几何缓存，实现高保真360°全景视频生成，确保数字孪生的时空一致性。

NEW 1 票 Ting-Hsuan Chen, Ying-Huan Chen, Tao Tu, Jie-Ying Lee

2 MetaphorVU：面向隐喻视频理解

MetaphorVU: Towards Metaphorical Video Understanding

当前多模态大模型在隐喻视频理解上因跨域映射能力弱而表现不足，本文提出新的基准数据集与增强框架以应对这一挑战。

NEW 1 票 Zhuoqun Li, Boxi Cao, Guiping Jiang, Fangrui Lv

3 AutoResearch AI：面向科学发现的AI驱动研究自动化

AutoResearch AI: Towards AI-Powered Research Automation for Scientific Discovery

AI系统正从任务级助手演进为工作流级科研自动化平台，在自主性、可复现性与多科学领域的问责机制上仍面临重要挑战。

NEW 3 票 Guiyao Tie, Jiawen Shi, Dingjie Song, Yixiao Huang

4 你的嵌入模型比你想象的更智能

Your Embedding Model is SMARTer Than You Think

SMART通过对比训练和后期交互推理，从单向量模型中挖掘潜在多向量能力，以更低计算成本实现多模态检索的最优性能。

NEW 4 票 Jianrui Zhang, Hyun Jung Lee, Sukanta Ganguly, Tae-Eui Kam

5 VaaWIT：面向多语言网络图像翻译的视觉感知大语言模型自适应

VaaWIT: Visual-Aware Adaptation of Large Language Models for Multilingual Web Image Translation

VaaWIT是端到端框架，通过双流注意力与视觉感知适配器引入细粒度视觉感知，增强大视觉语言模型的多语言网络图像翻译能力。

NEW 1 票 Bo Li, Ronghao Chen, Ningyuan Deng, Huacan Wang

6 Mix-MoE：通过混合专家架构提升大语言模型的多语言机器翻译

Mix-MoE: Improving Multilingual Machine Translation of Large Language Models through Mixed MoEs

Mix-MoE采用混合MoE框架，将语言建模与翻译专长分离到不同专家组，并引入傅里叶变换增强路由，解决多语言翻译中的参数干扰问题。

NEW 1 票 Bo Li, Tianyu Dong, Shaolin Zhu, Deyi Xiong

7 Soap2Soap：基于多智能体协作的长篇电影视频翻拍

Soap2Soap: Long Cinematic Video Remaking via Multi-Agent Collaboration

Soap2Soap是面向长时序视频生成的多智能体框架，通过一致语义骨架与视觉参考锚点，在长视频序列中保持叙事结构与角色身份一致性。

NEW 1 票 Yiren Song, Huilin Zhong, Kevin Qinghong Lin, Haofan Wang

8 以有限元分析为反馈的自改进CAD生成智能体

Self-Improving CAD Generation Agents with Finite Element Analysis as Feedback

通过引入有限元分析进行工程验证，并改进与真实设计流程更对齐的监督信号，提升基于学习的CAD生成系统的设计合理性。

NEW 1 票 Guijin Son, Jehyun Park, Seyeon Park, Sunghee Ahn

9 面向自回归MRI重建的下一加速尺度预测

Next-Acceleration-Scale Prediction for Autoregressive MRI Reconstruction

利用视觉自回归建模技术与特权信息蒸馏，实现离散自回归MRI重建，在极端欠采样条件下取得优越的重建性能。

NEW 0 票 Yilmaz Korkmaz, Vishal M. Patel

10 均衡推理器：学习吸引子以实现可扩展推理

Equilibrium Reasoners: Learning Attractors Enables Scalable Reasoning

均衡推理器通过任务条件化吸引子引导潜在动力系统趋向有效解，利用测试时迭代计算显著提升推理准确率，实现可扩展推理。

NEW 2 票 Benhao Huang, Zhengyang Geng, Zico Kolter

📝 ArXiv 最新 AI 论文

1 BOHM: Zero-Cost Hierarchical Attribution for Compound AI Systems

arXiv:2605.22866v1 Announce Type: new Abstract: Compound AI systems route tasks through hierarchies of specialised components. Attribution is dominated by Shapley-based methods (SHAP), which decompose

NEW Joss Armstrong · Mon, 25 Ma cs.AI

2 NeuroNL2LTL: A Neurosymbolic Framework for Natural Language Translation of Linear Temporal Logic

arXiv:2605.22874v1 Announce Type: new Abstract: Effectively translating between natural language (NL) and formal logics like Linear Temporal Logic (LTL) requires expertise that limits formal verificat

NEW Paapa Kwesi Quansah, Ernest Bonnah · Mon, 25 Ma cs.AI

3 RMA: an Agentic System for Research-Level Mathematical Problems

arXiv:2605.22875v1 Announce Type: new Abstract: We present $\textbf{Research Math Agents (RMA)}$, an agentic framework for automated reasoning on research-level mathematical problems. Unlike prior stu

NEW Zelin Zhao, Bo Yuan, Jaemoo Choi 等 · Mon, 25 Ma cs.AI

4 SciAtlas: A Large-Scale Knowledge Graph for Automated Scientific Research

arXiv:2605.22878v1 Announce Type: new Abstract: The exponential growth of global academic output has confronted researchers and AI agents with an unprecedented ``information explosion,'' where fragmen

NEW Shuofei Qiao, Yunxiang Wei, Jiazheng Fan 等 · Mon, 25 Ma cs.AI

5 Energy per Successful Goal: Goal-Level Energy Accounting for Agentic AI Systems

arXiv:2605.22883v1 Announce Type: new Abstract: Current AI energy benchmarks measure consumption at the granularity of a single model invocation or training run. For classical single-turn workloads th

NEW Deepak Panigrahy, Aakash Tyagi · Mon, 25 Ma cs.AI

6 ImProver 2: Iteratively Self-Improving LMs for Neurosymbolic Proof Optimization

arXiv:2605.22885v1 Announce Type: new Abstract: Formal mathematics libraries are rapidly expanding, creating a growing need to refactor verified proofs for maintainability and to improve training data

NEW Riyaz Ahuja, Tate Rowney, Jeremy Avigad 等 · Mon, 25 Ma cs.AI

7 Mediative Fuzzy Logic: From Type-1 Foundations to Type-2, Type-3 and Quantum Extensions

arXiv:2605.22900v1 Announce Type: new Abstract: Mediative Fuzzy Logic was conceived as a practical scheme for reconciling hesitant or conflicting assessments in fuzzy control and decision-making. Howe

NEW Oscar Montiel Ross · Mon, 25 Ma cs.AI

8 EVE-Agent: Evidence-Verifiable Self-Evolving Agents

arXiv:2605.22905v1 Announce Type: new Abstract: Self-evolving agents should not train on examples they cannot justify. Data-free self-evolving search agents offer a scalable route to systems that gene

NEW Yamato Arai, Yuma Ichikawa · Mon, 25 Ma cs.AI

9 The Deterministic Horizon: Impossibility Results as Design Specifications for Trustworthy AI Systems

arXiv:2605.23024v1 Announce Type: new Abstract: Large language models now write software, draft legal documents, and produce clinical notes, yet fundamental limits, from Turing and Arrow to the No Fre

NEW Dongxin Guo · Mon, 25 Ma cs.AI

10 PathCal: State-Aware Reflection-Marker Calibration for Efficient Reasoning

arXiv:2605.23074v1 Announce Type: new Abstract: The emergence of Large Reasoning Language Models (LRMs) has paved the way for tackling complex reasoning tasks through test-time scaling by generating l

NEW Lingyu Jiang, Zirui Li, Shuo Xing 等 · Mon, 25 Ma cs.AI

11 Inductive Deductive Synthesis: Enabling AI to Generate Formally Verified Systems

arXiv:2605.23109v1 Announce Type: new Abstract: AI agents increasingly excel at generating, testing, and refining code. However, they fall short on tasks requiring formal guarantees of full coverage t

NEW Shubham Agarwal, Alexander Krentsel, Shu Liu 等 · Mon, 25 Ma cs.AI

12 Redrawing the AI Map: A Theory of Accountability Boundaries in Agentic Ecosystems

arXiv:2605.23179v1 Announce Type: new Abstract: Agentic AI orchestrators reduce the interface and assembly costs of composing information systems capabilities across organizational boundaries, seeming

NEW Muhammad Zia Hydari, Farooq Muzaffar · Mon, 25 Ma cs.AI

🔥 AI 社区热议

1 [讨论] 自我推广帖

r/MachineLearning 定期开放的自我推广线程，供研究者和开发者分享自己的项目、论文、工具或成果。

连续16天 Reddit r/MachineLearning

2 [讨论] 每月招聘与求职帖

r/MachineLearning 每月固定的招聘信息汇总帖，雇主发布岗位需求，求职者展示技能背景，促进ML领域人才双向对接。

连续14天 Reddit r/MachineLearning

3 著名的METR AI时间跨度图表存在大量严重错误

有人指出METR发布的AI能力时间跨度评估图表存在多处严重错误，引发社区对AI进展基准测试可靠性的深入讨论与质疑。

NEW Reddit r/MachineLearning

4 参加ICML Workshop值得吗？

讨论ICML研讨会的参会价值，涉及学术社交、论文曝光、与大会主会场相比的性价比，适合不同阶段研究者的经验分享。

NEW Reddit r/MachineLearning

5 在微控制器上运行DCGAN推理：1260万参数、512KB SRAM、26秒生成、纯C实现

开发者在资源极度受限的微控制器上实现DCGAN推理，仅用512KB内存运行千万级参数模型，展示边缘AI极限压缩的工程壮举。

NEW Reddit r/MachineLearning

6 重构Agent方法论：解耦决策与执行——开源项目

开源项目提出将AI Agent的决策层与执行层解耦的新架构，旨在提升Agent系统的模块化程度、可控性和复用性。

NEW Reddit r/MachineLearning

7 《金融时报》发表了关于Heretic的文章

FT报道了本地LLM相关项目或公司Heretic，社区讨论其技术路线、商业模式及对本地AI生态的潜在影响。

NEW Reddit r/LocalLLaMA

8 12块32GB SXM V100集群进展更新 / 本地AI用于法律文书起草

用户分享自建12卡V100高性能集群的最新进展，重点介绍将本地大模型用于法律文书起草的实际应用效果与技术挑战。

NEW Reddit r/LocalLLaMA

9 NuExtract3发布：支持Markdown、OCR和结构化提取的开源4B视觉语言模型

NuExtract3是可自托管的4B参数VLM，专注Markdown解析、OCR识别和结构化信息提取，开源权重适合本地部署场景。

NEW Reddit r/LocalLLaMA

10 Qwen3-6B是目前本地Agentic任务的最佳选择吗？

社区讨论Qwen3-6B在本地Agent应用中的实际表现，对比其他同量级模型的工具调用能力、指令遵循和推理稳定性。

NEW Reddit r/LocalLLaMA

11 MiniCPM5-1B发布

面壁智能发布MiniCPM5-1B超小模型，社区关注其在极低参数规模下的性能表现及本地轻量部署的适用场景。

NEW Reddit r/LocalLLaMA

12 用本地LLM即时生成自定义交互式递归教科书

开发者展示利用本地LLM动态生成个性化、可交互的递归结构教科书的方案，探索AI辅助自适应学习内容生成的新范式。

NEW Reddit r/LocalLLaMA

📰 Hacker News AI

1 Using AI to write better code more slowly

用 AI 写出更好的代码，但速度更慢

作者分享使用 AI 辅助编程的体验：AI 能帮助写出更高质量、更深思熟虑的代码，但并不必然提升速度，反而促使开发者放慢脚步、更认真地思考设计决策。

NEW 145 分 45 条评论

2 Norway's 2 petabytes of Huawei flash storage and LLM training

挪威 2PB 华为闪存与大模型训练

挪威采购了 2 拍字节华为闪存用于支撑大语言模型训练基础设施，文章探讨该规模存储选型的技术与地缘政治背景，以及华为在 AI 存储市场的竞争力。

NEW 162 分 75 条评论

3 CVE-2026-28952: Apple macOS 26.5 Kernel Vuln found by Claude

CVE-2026-28952：Claude 发现 Apple macOS 26.5 内核漏洞

Anthropic 的 Claude AI 自主发现了 Apple macOS 26.5 中的一个内核级安全漏洞，已获 CVE 编号，标志着 AI 系统在漏洞挖掘领域取得重要突破。

NEW 66 分 22 条评论

4 Microsoft Copilot Cowork Exfiltrates Files

Microsoft Copilot Cowork 功能存在文件外泄漏洞

安全研究人员发现 Microsoft Copilot 的 Cowork 功能存在提示注入漏洞，攻击者可借此窃取并外泄用户文件，揭示企业级 AI 助手在文档场景中的安全隐患。

NEW 189 分 38 条评论

5 Agentic Patterns

智能体模式研究

veso.ai 发布的研究报告，系统梳理 AI 智能体的常见设计模式，包括规划、工具调用、多智能体协作等范式，为构建可靠 Agentic 系统提供参考框架。

NEW 15 分 4 条评论

6 Weave (YC W25) is hiring ML, AI, product, & design engineers

Weave（YC W25）招聘 ML/AI/产品/设计工程师

YC 2025 冬季批次创业公司 Weave 正在招募机器学习、AI、产品及设计工程师，面向有意加入早期 AI 创业团队的求职者。

NEW 1 分 0 条评论

7 Every Frontier AI Is INTJ

所有前沿 AI 都是 INTJ 人格

作者对主流前沿 AI 模型进行 MBTI 测试，发现它们几乎清一色呈现 INTJ（建筑师型）人格特征，并探讨这是训练数据偏差还是智能涌现的必然结果。

NEW 16 分 7 条评论

8 AI errno(2) values

AI 的 errno 错误值表现

作者测试各大 AI 模型对 Unix errno 错误码的掌握程度，发现模型在处理底层系统编程知识时存在明显的幻觉与混淆，揭示 AI 在系统级知识上的局限性。

NEW 119 分 18 条评论

9 The Vatican-Anthropic relationship that's reshaping the AI ethics debate

梵蒂冈与 Anthropic 的合作正在重塑 AI 伦理辩论

Anthropic 协助梵蒂冈发布教皇关于 AI 的新通谕，双方在 AI 伦理框架上的合作引发广泛关注，探讨宗教机构如何参与塑造全球 AI 治理议题。

NEW 6 分 1 条评论

10 Cox Media fined after bragging it spied on users through their phones

Cox Media 因吹嘘通过手机麦克风监听用户而被罚款

美国联邦贸易委员会对 Cox Media 展开处罚，该公司曾公开宣称其 AI 营销产品能监听用户手机麦克风并定向投放广告，此案引发对 AI 驱动隐私侵犯的强烈警示。

NEW 12 分 0 条评论

今日洞察

AI 行业日报 · 2026-05-26

今日速览

重点项目点评

1. affaan-m/ECC ⭐ 新 · +2,025 stars

2. anthropics/knowledge-work-plugins · +1,441 stars

3. CVE-2026-28952：Claude 发现 macOS 内核漏洞（HN #3）

4. EVE-Agent：Evidence-Verifiable Self-Evolving Agents · 新论文

5. BOHM：零成本层次化归因（Compound AI Systems）· 新论文

趋势洞察

方向一：AI Agent 基础设施的"垂直化"分工

方向二：AI 安全进入"攻守同体"新格局

方向三：科学研究自动化的知识图谱底座

值得跟进

1. `affaan-m/ECC` ⭐ 新 · +2,025 stars

2. `anthropics/knowledge-work-plugins` · +1,441 stars