AI简讯

沧浪同学2026-03-012026-04-20

本帖主要存放一些与 AI 有关的资讯

AI Agent市场格局分析：半数市场集中单一领域，其余赛道蓝海广阔

核心报告基础信息

发布机构：Anthropic（Claude大模型母公司）
报告名称：Measuring AI agent autonomy in practice
官方链接：https://anthropic.com/research/measuring-agent-autonomy
研究样本：Anthropic公共API上数百万次真实的人机交互数据
核心观点引用：Y Combinator（YC）CEO陈嘉兴、Box创始人Aaron Levie

核心市场特征（基于Anthropic报告核心数据）

行业分布极度不均：AI Agent工具调用量49.7%集中在软件工程领域，剩余16个垂直行业（医疗、法律、金融、教育等）占比均不足9%，其中医疗1%、法律0.9%、教育1.8%（https://news.marsbit.co/20260224155512573325.html）。
技术能力与实际应用存在落差：AI Agent技术上可独立连续工作近5小时，但实际使用中用户单次授权最长仅42分钟，存在显著的「信任赤字」问题（https://anthropic.com/research/measuring-agent-autonomy）。
信任度随使用经验提升：老用户对AI Agent的「全自动批准」使用比例超40%（新手仅20%），人机协作模式从「逐项审批」向「委托+监控」转变（https://36kr.com/p/3698509304737669）。
行业整体安全性可控：AI Agent的工具调用中73%有人工监管，仅0.8%为不可逆操作，高风险操作多为安全演练而非实际生产场景（http://www.shturl.cc/25461eaede8aeea41253410903fb107a）。

市场机遇与行业观点

非软件工程领域为绝对蓝海：16个垂直领域均处于未开发状态，Y Combinator（YC）CEO陈嘉兴认为该领域蕴藏下一代300个独角兽创业机会，核心壁垒为「行业知识+数据壁垒+信任体系」（https://news.qq.com/rain/a/20250316A055GL00、https://m.toutiao.com/group/7610773312733545011/?upstream_biz=doubao）。
信任赤字是核心产品机会：2025年10月-2026年1月用户对AI Agent的单次使用时长近乎翻倍，驱动因素为人类使用习惯磨合而非单纯模型升级，合理的产品设计可有效释放AI生产力（https://36kr.com/p/3698509304737669）。
垂直领域落地有明确模板：Box创始人Aaron Levie提出，需构建「接入专有数据+领域专属上下文工程+客户侧变更管理」的Agent软件，才能适配垂直行业独特流程（https://news.marsbit.co/20260224155512573325.html）。

行业发展趋势

人机「共建」成核心协作模式：AI Agent在复杂任务中会主动暂停确认，而非盲目执行，人类监管与AI自主的平衡成为产品设计关键（https://anthropic.com/research/measuring-agent-autonomy）。
技术经验可跨行业复制：软件工程领域的AI Agent技术成熟度最高，其落地的信任构建、人机协作经验，可成为其他垂直行业渗透的重要参考（http://www.shturl.cc/24f1a5f7afb2835b2182ec48b50b1a60）。
企业AI投资落地率极低：麦肯锡数据显示，92%的企业计划增加AI投资，但仅1%进入成熟部署阶段，垂直赛道仍处于起跑阶段（https://m.toutiao.com/group/7610773312733545011/?upstream_biz=doubao）。

原文出处

garryslist.org原文章链接：https://garryslist.org/posts/half-the-ai-agent-market-is-one-category-the-rest-is-wide-open

中国AI模型调用量首超美国四款国产模型霸榜全球前五

核心数据（来源：OpenRouter平台监测）

调用量反超：2月9-15日中国模型Token调用量4.12万亿，首超美国的2.94万亿；2月16-22日中国模型冲高至5.16万亿Token，三周累计大涨127%，美国模型跌至2.7万亿Token[https://openrouter.ai/]。
榜单格局：OpenRouter平台全球调用量前五的模型中，四款为中国厂商产品，合计贡献Top5总调用量的85.7%[https://www.cls.cn/detail/2296282]。
用户结构：平台用户以海外开发者为主，美国用户占比47.17%，中国开发者仅6.01%，数据客观反映国产模型全球吸引力[https://www.cls.cn/detail/2296282]。
https://openrouter.ai/rankings

霸榜的四款国产大模型

MiniMax的M2.5
月之暗面的Kimi K2.5
智谱的GLM-5
DeepSeek的V3.2[https://www.cls.cn/detail/2296282]

Token出海产业链核心标的与逻辑

核心基础设施商

网宿科技：国内最大中立CDN服务商，是Token出海跨境网络传输的刚需，为海外调用国产大模型提供低延迟、稳定的传输通道[https://www.cls.cn/detail/2296282]。

算力核心标的（2026.2市场梳理）

鸿博股份(002229)：MiniMax独家核心算力供应商，北京4000P算力储备（H200占60%），美国自建智算中心且获英伟达DGX独家授权[https://www.cls.cn/detail/2296282]。
润泽科技(300442)：Kimi、DeepSeek主力算力底座，承接Kimi新增算力50%+，2026年算力租赁收入预计增80%-120%[https://www.cls.cn/detail/2296282]。

AI产业链直接受益标的排序

算力硬件（最稳最直接）：海光信息、寒武纪、中科曙光、浪潮信息、中际旭创[https://www.cls.cn/detail/2296282]。
大模型参股（弹性最大）：电广传媒、视觉中国、凌云光[https://www.cls.cn/detail/2296282]。
语料（高毛利、分成兑现）：掌阅科技、中文在线[https://www.cls.cn/detail/2296282]。

市场热议观点

算力需求为核心硬逻辑，算力租赁、算力硬件、电力设备为直接受益方向[https://www.cls.cn/detail/2296282]。
Token出海为AI产业核心主线，海外用户对国产大模型的高调用量带动跨境传输、算力租赁等产业链环节发展[https://www.cls.cn/detail/2296282]。
市场对AI应用板块反弹有预期，同时关注算力板块高位波动风险[https://www.cls.cn/detail/2296282]。

豆包手机助手安全漏洞争议全梳理：研究指风险/官方斥炒作/媒体实测曝问题

一、DarkNavy安全研究核心结论[https://zhuanlan.zhihu.com/p/2009943972991235519]

技术架构：豆包手机助手基于Android定制系统Obric，核心由ObricAiAgent、ObricAutoAction等模块构成，采用「感知—推理—执行」循环实现跨应用自动操作，云端VLM推理为核心，端侧仅做辅助。
安全防护设计：具备UID/包名/签名多重鉴权、TEE保护的mTLS双向认证、高敏页面占位图替换、敏感词拦截、动作执行前校验等机制，高敏应用（微信/支付宝/银行APP）被禁止自动化操作。
发现的核心风险：
- Prompt Injection风险：对屏幕截图内容无过滤，仅依赖云端，可通过构造界面文本诱导模型，或干扰高敏操作检测，存在窃取验证码、记忆数据等信息泄露可能。
- GUI TOCTOU固有风险：云端推理2-3秒的时间差可能导致界面变化，AI误操作，且无操作回滚/报警机制，仅点击操作有校验，其他操作无防护。
- 本地数据风险：明文会话日志与截图持久化存储于私有目录，理论存在本地泄露可能。
风险验证：实验中可通过恶意信息干扰，在特定条件下劫持智能体，获取模型System Prompt，存在纳入黑客攻击链的可能性。

二、豆包手机官方严正回应[https://www.36kr.com/newsflashes/3701042411663236]

定性事件：相关漏洞演示为「恶意炒作的黑公关行为」，违规公开漏洞已涉嫌违反《网络产品安全漏洞管理规定》。
核心澄清：网传漏洞演示需用户主动指令AI查看恶意邮件/短信才会触发，无用户指令AI不会自动执行高风险操作。
官方现状：未收到漏洞详细报告，未接到网络安全监管部门相关通报。
应对措施：针对视频演示的攻击方法，已完成豆包手机助手的防护措施升级，字节跳动设有公开安全漏洞响应平台并提供丰厚奖励。

三、经济参考报实测与专家观点[https://mp.weixin.qq.com/s/YOfHD_v_eId6_kZi_dyTSQ]

实测结果：搭载AI助手的手机可被恶意邮件劫持，AI在无安全提醒的情况下，将银行验证码转发给攻击者，还可窃取/拍摄用户照片，结合AI生成视频可突破人脸识别。
核心问题：AI助手获取「无障碍服务/事件注入权限」等系统级高权限，授权方式为一次性/长期授予，缺乏动态授权和用户感知，权限聚合过度且隔离不足。
专家建议：
- 坚持「最小必要原则」，明确AI能力边界，高危动作（验证码/支付）仅提供建议，禁止自动执行。
- 建立用户+App双重授权机制，赋予一键喊停权利，验证码等敏感信息禁止自动转发。
- 行业制定统一协作标准，建立安全认证制度和动态治理机制。

四、恶意炒作文章核心问题[https://mp.weixin.qq.com/s/77ieFamDHh02pTkLQHV5_Q]

炒作手段：恶意融合DarkNavy的客观安全研究、经济参考报的实测调查内容，歪曲解读豆包手机助手的安全风险。
信息误导：将经济参考报的实测演示视频归为漏洞实锤，忽视豆包助手的安全防护设计，放大风险并关联产品重启事件制造舆论。
补充背景：豆包手机助手因高权限自动操作曾遭行业抵制，进行过功能阉割（下线高敏应用操作），后续尝试与手机厂商合作重启，采用GUI Agent技术路线是争议另一核心。

五、AI手机助手技术路线争议[https://mp.weixin.qq.com/s/77ieFamDHh02pTkLQHV5_Q]

豆包采用的GUI Agent：通过读屏、模拟点击实现操作，技术门槛低，无需生态构建，但高权限带来高安全风险，被指违背最小必要原则。
海外主流的A2A架构：通过应用API接口实现数据交互，无读屏需求，权限可控，从根源规避劫持风险，苹果/谷歌/华为等已采用该路线。
行业趋势：新加坡已将A2A定为推荐方式，国产厂商如华为、vivo也开始转向A2A，GUI路线的局限性逐渐凸显。

上海首例游戏“剧透”刑案：米哈游知名泄密者“妮可少女”被抓

一、案件核心信息

涉案人员：3名“00后”犯罪嫌疑人（苏某、吴某、周某），其中周某系游戏圈知名泄密者“妮可少女”，为在读数学系博士，具备专业反编译技术能力[http://m.toutiao.com/group/7611493891327083023/?upstream_biz=doubao]。
泄密行为：
- 核心操作：周某通过反编译游戏测试包体，提取米哈游旗下未公开的角色建模、场景设计、技能动画等核心内容[https://mp.weixin.qq.com/s/mglM_ikUWWxzPzxcGJp7GQ]。
- 传播渠道：B站、抖音等社交媒体、自建“玉衡杯”网站、私域社群、境外社交平台及相关电报频道[http://m.toutiao.com/group/7611748626519425578/?upstream_biz=doubao]。
- 传播规模：单条剧透视频点击量超10万次，总播放量达1300万次，部分视频虽1-2天内被下架仍造成广泛传播[http://m.toutiao.com/group/7611493891327083023/?upstream_biz=doubao]。
案件进展：2025年10月至2026年1月警方分批次抓获嫌疑人，查获电脑、手机等作案工具；苏某、吴某（仅转载）被检察机关移送起诉，周某（核心泄密者）被采取刑事强制措施，案件正在进一步侦办[https://mp.weixin.qq.com/s/mglM_ikUWWxzPzxcGJp7GQ]。
关键印证：2026年2月，“妮可少女”相关电报频道及“玉衡杯”网站相继关闭，与抓捕时间线高度吻合[https://nga.178.com/read.php?page=e&tid=46277071]。

二、法律依据与入刑标准

核心法规：2025年4月“两高”发布《关于办理侵犯知识产权刑事案件适用法律若干问题的解释》[https://www.court.gov.cn/zixun/xingfa/202504/t20250415_4078216.shtml]。
入刑条件：通过信息网络传播他人作品、录音录像制品等，满足以下任一条件即涉嫌刑事犯罪：
- 传播数量合计500件（部）以上；
- 被点击数量达到10万次以上[https://mp.weixin.qq.com/s/mglM_ikUWWxzPzxcGJp7GQ]。
案件意义：上海首例以刑事手段打击游戏“剧透”行为的案例，此前游戏泄密多通过平台封号、民事诉讼维权，本案标志着刑事打击成为重要手段[http://m.toutiao.com/group/7611425168958685715/?upstream_biz=doubao]。

三、泄密行为的三大危害（米哈游法务总监罗希观点）

破坏玩家沉浸式体验：提前泄露碎片化内容，剥夺玩家对未知内容的探索乐趣[https://mp.weixin.qq.com/s/mglM_ikUWWxzPzxcGJp7GQ]。
扰乱游戏社区生态：片面信息易引发恶意解读，导致玩家社群误解、争论甚至对立[http://m.toutiao.com/group/7611437307022852642/?upstream_biz=doubao]。
造成企业运营损失：打乱新版本宣传节奏，不实信息扩散损害游戏口碑与品牌声誉，本案给米哈游造成实质性损害[https://mp.weixin.qq.com/s/mglM_ikUWWxzPzxcGJp7GQ]。

四、涉案人员认知误区与案件警示

嫌疑人误区：周某等人辩称“仅为游戏爱好者，平台警告后删视频即可，无需承担其他责任”，忽视了刑事犯罪的认定标准[http://m.toutiao.com/group/7611493891327083023/?upstream_biz=doubao]。
行业警示：
- 不仅核心泄密者追责，转载、传播侵权内容也可能构成犯罪；
- 高学历、技术能力不能成为违法借口，游戏测试包破解、未公开内容泄露均受法律约束；
- 文创产业新型犯罪受重点打击，警企直联机制将持续深化[https://mp.weixin.qq.com/s/mglM_ikUWWxzPzxcGJp7GQ]。
OpenAI与美国战争部机密AI部署协议全解析（2026.2.28）

一、协议核心背景与目标

合作双方：OpenAI 与美国战争部（DoW，特朗普政府对国防部的称呼）[https://3g.163.com/mobile/article/KMS4QC6D0514R9P4.html]。
部署场景：机密环境下的先进AI系统应用，OpenAI 要求政府将相同协议条款开放给所有AI公司。
合作初衷：
- 支持美军应对潜在对手的AI技术威胁，提供合规且强大的AI工具。
- 缓和战争部与美国AI实验室的紧张关系（此前Anthropic与政府谈判破裂），推动政府与AI行业深度协作[https://openai.com/index/our-agreement-with-the-department-of-war/]。
事件关联：协议达成于特朗普政府下令联邦机构停用Anthropic AI模型数小时后，成为OpenAI在商业与政治层面的重要突破[https://3g.163.com/mobile/article/KMS4QC6D0514R9P4.html]。

二、三大核心安全红线（禁止性条款）

严禁大规模国内监控：
- 私人信息处理仅限外国情报目的，遵守《第四修正案》《FISA》《第12333号行政命令》等法规。
- 不得对美国公民进行无约束监控，除《Posse Comitatus Act》（民兵法案）允许的例外情形外，禁止用于国内执法[https://openai.com/index/our-agreement-with-the-department-of-war/]。
禁止自主武器系统操控：
- 不得利用OpenAI技术独立指挥需人类控制的自主武器，符合《DoD Directive 3000.09》要求——自主/半自主武器系统必须经严格验证测试，确保人类对武力使用的判断权[http://www.studytimes.cn/dsgs/202508/t20250811_82262.html]。
禁止高风险自动化决策：
- 排除“社会信用体系”等涉及高 stakes 的自动化决策场景，此类决策需人类审批[https://openai.com/index/our-agreement-with-the-department-of-war/]。

三、多层级安全保障机制

部署架构：仅限云端部署，不提供“无防护”或未经过安全训练的模型，不部署于边缘设备（避免用于致命自主武器）[https://openai.com/index/our-agreement-with-the-department-of-war/]。
- 核心优势：OpenAI 可独立验证红线遵守情况，通过运行和更新分类器实时监控。
合同约束：
- 明确AI系统仅用于合法目的，遵守现有法律、操作要求及安全监督协议。
- 引用现行法规固定约束标准，即便未来法律或政策变更，仍需遵循协议签订时的安全标准[https://openai.com/index/our-agreement-with-the-department-of-war/]。
专家全程介入：
- 派遣获得许可的OpenAI工程师驻场支持，安全与对齐研究人员全程参与，确保技术使用合规[https://openai.com/index/our-agreement-with-the-department-of-war/]。
自主退出权：若政府违反协议条款，OpenAI 可终止合作[https://openai.com/index/our-agreement-with-the-department-of-war/]。

四、与Anthropic的关键差异及立场

协议优势：OpenAI 称其协议比Anthropic的谈判条款更具保障性，红线可执行性更强（云端部署+安全栈控制权+人员介入）[https://openai.com/index/our-agreement-with-the-department-of-war/]。
核心分歧：Anthropic 因担忧自主武器和国内监控风险，拒绝满足政府“完全开放使用限制”的要求，导致谈判破裂；OpenAI 则通过技术防护+合同约束的方式，在同意“合法用途全覆盖”的同时保留安全管控权[https://3g.163.com/mobile/article/KMS4QC6D0514R9P4.html]。
OpenAI 立场：明确反对将Anthropic列为“供应链风险”，并呼吁政府与Anthropic解决分歧[https://openai.com/index/our-agreement-with-the-department-of-war/]。

五、行业与法律背景补充

自主武器定义：根据《DoD Directive 3000.09》，自主武器系统指无需人为干预即可自主选择并攻击目标的系统，致命性自主武器系统需保留人类决策空间[http://www.studytimes.cn/dsgs/202508/t20250811_82262.html]。
国内执法限制：《Posse Comitatus Act》确立“军队原则不承担国内执法”的制度底线，仅国会明确授权时可突破[http://m.toutiao.com/group/7587304693618016810/?upstream_biz=doubao]。
行业竞争格局：谷歌、xAI 已与美国国防部签订机密AI合作协议，OpenAI 协议进一步加剧行业在国防领域的协作竞争[https://3g.163.com/mobile/article/KMS4QC6D0514R9P4.html]。

本帖主要存放一些与 AI 有关的资讯

AI Agent市场格局分析：半数市场集中单一领域，其余赛道蓝海广阔

核心报告基础信息

核心市场特征（基于Anthropic报告核心数据）

市场机遇与行业观点

行业发展趋势

原文出处

中国AI模型调用量首超美国 四款国产模型霸榜全球前五

核心数据（来源：OpenRouter平台监测）

霸榜的四款国产大模型

Token出海产业链核心标的与逻辑

核心基础设施商

算力核心标的（2026.2市场梳理）

AI产业链直接受益标的排序

市场热议观点

豆包手机助手安全漏洞争议全梳理：研究指风险/官方斥炒作/媒体实测曝问题

一、DarkNavy安全研究核心结论[https://zhuanlan.zhihu.com/p/2009943972991235519]

二、豆包手机官方严正回应[https://www.36kr.com/newsflashes/3701042411663236]

三、经济参考报实测与专家观点[https://mp.weixin.qq.com/s/YOfHD_v_eId6_kZi_dyTSQ]

四、恶意炒作文章核心问题[https://mp.weixin.qq.com/s/77ieFamDHh02pTkLQHV5_Q]

五、AI手机助手技术路线争议[https://mp.weixin.qq.com/s/77ieFamDHh02pTkLQHV5_Q]

上海首例游戏“剧透”刑案：米哈游知名泄密者“妮可少女”被抓

一、案件核心信息

二、法律依据与入刑标准

三、泄密行为的三大危害（米哈游法务总监罗希观点）

四、涉案人员认知误区与案件警示

OpenAI与美国战争部机密AI部署协议全解析（2026.2.28）

一、协议核心背景与目标

二、三大核心安全红线（禁止性条款）

三、多层级安全保障机制

四、与Anthropic的关键差异及立场

五、行业与法律背景补充

沧浪同学

中国AI模型调用量首超美国四款国产模型霸榜全球前五