AI简讯

AI简讯
沧浪同学本帖主要存放一些与 AI 有关的资讯
AI Agent市场格局分析:半数市场集中单一领域,其余赛道蓝海广阔
核心报告基础信息
- 发布机构:Anthropic(Claude大模型母公司)
- 报告名称:Measuring AI agent autonomy in practice
- 官方链接:https://anthropic.com/research/measuring-agent-autonomy
- 研究样本:Anthropic公共API上数百万次真实的人机交互数据
- 核心观点引用:Y Combinator(YC)CEO陈嘉兴、Box创始人Aaron Levie
核心市场特征(基于Anthropic报告核心数据)
- 行业分布极度不均:AI Agent工具调用量49.7%集中在软件工程领域,剩余16个垂直行业(医疗、法律、金融、教育等)占比均不足9%,其中医疗1%、法律0.9%、教育1.8%(https://news.marsbit.co/20260224155512573325.html)。
- 技术能力与实际应用存在落差:AI Agent技术上可独立连续工作近5小时,但实际使用中用户单次授权最长仅42分钟,存在显著的「信任赤字」问题(https://anthropic.com/research/measuring-agent-autonomy)。
- 信任度随使用经验提升:老用户对AI Agent的「全自动批准」使用比例超40%(新手仅20%),人机协作模式从「逐项审批」向「委托+监控」转变(https://36kr.com/p/3698509304737669)。
- 行业整体安全性可控:AI Agent的工具调用中73%有人工监管,仅0.8%为不可逆操作,高风险操作多为安全演练而非实际生产场景(http://www.shturl.cc/25461eaede8aeea41253410903fb107a)。
市场机遇与行业观点
- 非软件工程领域为绝对蓝海:16个垂直领域均处于未开发状态,Y Combinator(YC)CEO陈嘉兴认为该领域蕴藏下一代300个独角兽创业机会,核心壁垒为「行业知识+数据壁垒+信任体系」(https://news.qq.com/rain/a/20250316A055GL00、https://m.toutiao.com/group/7610773312733545011/?upstream_biz=doubao)。
- 信任赤字是核心产品机会:2025年10月-2026年1月用户对AI Agent的单次使用时长近乎翻倍,驱动因素为人类使用习惯磨合而非单纯模型升级,合理的产品设计可有效释放AI生产力(https://36kr.com/p/3698509304737669)。
- 垂直领域落地有明确模板:Box创始人Aaron Levie提出,需构建「接入专有数据+领域专属上下文工程+客户侧变更管理」的Agent软件,才能适配垂直行业独特流程(https://news.marsbit.co/20260224155512573325.html)。
行业发展趋势
- 人机「共建」成核心协作模式:AI Agent在复杂任务中会主动暂停确认,而非盲目执行,人类监管与AI自主的平衡成为产品设计关键(https://anthropic.com/research/measuring-agent-autonomy)。
- 技术经验可跨行业复制:软件工程领域的AI Agent技术成熟度最高,其落地的信任构建、人机协作经验,可成为其他垂直行业渗透的重要参考(http://www.shturl.cc/24f1a5f7afb2835b2182ec48b50b1a60)。
- 企业AI投资落地率极低:麦肯锡数据显示,92%的企业计划增加AI投资,但仅1%进入成熟部署阶段,垂直赛道仍处于起跑阶段(https://m.toutiao.com/group/7610773312733545011/?upstream_biz=doubao)。
原文出处
garryslist.org原文章链接:https://garryslist.org/posts/half-the-ai-agent-market-is-one-category-the-rest-is-wide-open
中国AI模型调用量首超美国 四款国产模型霸榜全球前五
核心数据(来源:OpenRouter平台监测)
- 调用量反超:2月9-15日中国模型Token调用量4.12万亿,首超美国的2.94万亿;2月16-22日中国模型冲高至5.16万亿Token,三周累计大涨127%,美国模型跌至2.7万亿Token[https://openrouter.ai/]。
- 榜单格局:OpenRouter平台全球调用量前五的模型中,四款为中国厂商产品,合计贡献Top5总调用量的85.7%[https://www.cls.cn/detail/2296282]。
- 用户结构:平台用户以海外开发者为主,美国用户占比47.17%,中国开发者仅6.01%,数据客观反映国产模型全球吸引力[https://www.cls.cn/detail/2296282]。
https://openrouter.ai/rankings
霸榜的四款国产大模型
- MiniMax的M2.5
- 月之暗面的Kimi K2.5
- 智谱的GLM-5
- DeepSeek的V3.2[https://www.cls.cn/detail/2296282]
Token出海产业链核心标的与逻辑
核心基础设施商
网宿科技:国内最大中立CDN服务商,是Token出海跨境网络传输的刚需,为海外调用国产大模型提供低延迟、稳定的传输通道[https://www.cls.cn/detail/2296282]。
算力核心标的(2026.2市场梳理)
- 鸿博股份(002229):MiniMax独家核心算力供应商,北京4000P算力储备(H200占60%),美国自建智算中心且获英伟达DGX独家授权[https://www.cls.cn/detail/2296282]。
- 润泽科技(300442):Kimi、DeepSeek主力算力底座,承接Kimi新增算力50%+,2026年算力租赁收入预计增80%-120%[https://www.cls.cn/detail/2296282]。
AI产业链直接受益标的排序
- 算力硬件(最稳最直接):海光信息、寒武纪、中科曙光、浪潮信息、中际旭创[https://www.cls.cn/detail/2296282]。
- 大模型参股(弹性最大):电广传媒、视觉中国、凌云光[https://www.cls.cn/detail/2296282]。
- 语料(高毛利、分成兑现):掌阅科技、中文在线[https://www.cls.cn/detail/2296282]。
市场热议观点
- 算力需求为核心硬逻辑,算力租赁、算力硬件、电力设备为直接受益方向[https://www.cls.cn/detail/2296282]。
- Token出海为AI产业核心主线,海外用户对国产大模型的高调用量带动跨境传输、算力租赁等产业链环节发展[https://www.cls.cn/detail/2296282]。
- 市场对AI应用板块反弹有预期,同时关注算力板块高位波动风险[https://www.cls.cn/detail/2296282]。
豆包手机助手安全漏洞争议全梳理:研究指风险/官方斥炒作/媒体实测曝问题
一、DarkNavy安全研究核心结论[https://zhuanlan.zhihu.com/p/2009943972991235519]
- 技术架构:豆包手机助手基于Android定制系统Obric,核心由ObricAiAgent、ObricAutoAction等模块构成,采用「感知—推理—执行」循环实现跨应用自动操作,云端VLM推理为核心,端侧仅做辅助。
- 安全防护设计:具备UID/包名/签名多重鉴权、TEE保护的mTLS双向认证、高敏页面占位图替换、敏感词拦截、动作执行前校验等机制,高敏应用(微信/支付宝/银行APP)被禁止自动化操作。
- 发现的核心风险:
- Prompt Injection风险:对屏幕截图内容无过滤,仅依赖云端,可通过构造界面文本诱导模型,或干扰高敏操作检测,存在窃取验证码、记忆数据等信息泄露可能。
- GUI TOCTOU固有风险:云端推理2-3秒的时间差可能导致界面变化,AI误操作,且无操作回滚/报警机制,仅点击操作有校验,其他操作无防护。
- 本地数据风险:明文会话日志与截图持久化存储于私有目录,理论存在本地泄露可能。
- 风险验证:实验中可通过恶意信息干扰,在特定条件下劫持智能体,获取模型System Prompt,存在纳入黑客攻击链的可能性。
二、豆包手机官方严正回应[https://www.36kr.com/newsflashes/3701042411663236]
- 定性事件:相关漏洞演示为「恶意炒作的黑公关行为」,违规公开漏洞已涉嫌违反《网络产品安全漏洞管理规定》。
- 核心澄清:网传漏洞演示需用户主动指令AI查看恶意邮件/短信才会触发,无用户指令AI不会自动执行高风险操作。
- 官方现状:未收到漏洞详细报告,未接到网络安全监管部门相关通报。
- 应对措施:针对视频演示的攻击方法,已完成豆包手机助手的防护措施升级,字节跳动设有公开安全漏洞响应平台并提供丰厚奖励。
三、经济参考报实测与专家观点[https://mp.weixin.qq.com/s/YOfHD_v_eId6_kZi_dyTSQ]
- 实测结果:搭载AI助手的手机可被恶意邮件劫持,AI在无安全提醒的情况下,将银行验证码转发给攻击者,还可窃取/拍摄用户照片,结合AI生成视频可突破人脸识别。
- 核心问题:AI助手获取「无障碍服务/事件注入权限」等系统级高权限,授权方式为一次性/长期授予,缺乏动态授权和用户感知,权限聚合过度且隔离不足。
- 专家建议:
- 坚持「最小必要原则」,明确AI能力边界,高危动作(验证码/支付)仅提供建议,禁止自动执行。
- 建立用户+App双重授权机制,赋予一键喊停权利,验证码等敏感信息禁止自动转发。
- 行业制定统一协作标准,建立安全认证制度和动态治理机制。
四、恶意炒作文章核心问题[https://mp.weixin.qq.com/s/77ieFamDHh02pTkLQHV5_Q]
- 炒作手段:恶意融合DarkNavy的客观安全研究、经济参考报的实测调查内容,歪曲解读豆包手机助手的安全风险。
- 信息误导:将经济参考报的实测演示视频归为漏洞实锤,忽视豆包助手的安全防护设计,放大风险并关联产品重启事件制造舆论。
- 补充背景:豆包手机助手因高权限自动操作曾遭行业抵制,进行过功能阉割(下线高敏应用操作),后续尝试与手机厂商合作重启,采用GUI Agent技术路线是争议另一核心。
五、AI手机助手技术路线争议[https://mp.weixin.qq.com/s/77ieFamDHh02pTkLQHV5_Q]
- 豆包采用的GUI Agent:通过读屏、模拟点击实现操作,技术门槛低,无需生态构建,但高权限带来高安全风险,被指违背最小必要原则。
- 海外主流的A2A架构:通过应用API接口实现数据交互,无读屏需求,权限可控,从根源规避劫持风险,苹果/谷歌/华为等已采用该路线。
- 行业趋势:新加坡已将A2A定为推荐方式,国产厂商如华为、vivo也开始转向A2A,GUI路线的局限性逐渐凸显。
上海首例游戏“剧透”刑案:米哈游知名泄密者“妮可少女”被抓
一、案件核心信息
- 涉案人员:3名“00后”犯罪嫌疑人(苏某、吴某、周某),其中周某系游戏圈知名泄密者“妮可少女”,为在读数学系博士,具备专业反编译技术能力[http://m.toutiao.com/group/7611493891327083023/?upstream_biz=doubao]。
- 泄密行为:
- 核心操作:周某通过反编译游戏测试包体,提取米哈游旗下未公开的角色建模、场景设计、技能动画等核心内容[https://mp.weixin.qq.com/s/mglM_ikUWWxzPzxcGJp7GQ]。
- 传播渠道:B站、抖音等社交媒体、自建“玉衡杯”网站、私域社群、境外社交平台及相关电报频道[http://m.toutiao.com/group/7611748626519425578/?upstream_biz=doubao]。
- 传播规模:单条剧透视频点击量超10万次,总播放量达1300万次,部分视频虽1-2天内被下架仍造成广泛传播[http://m.toutiao.com/group/7611493891327083023/?upstream_biz=doubao]。
- 案件进展:2025年10月至2026年1月警方分批次抓获嫌疑人,查获电脑、手机等作案工具;苏某、吴某(仅转载)被检察机关移送起诉,周某(核心泄密者)被采取刑事强制措施,案件正在进一步侦办[https://mp.weixin.qq.com/s/mglM_ikUWWxzPzxcGJp7GQ]。
- 关键印证:2026年2月,“妮可少女”相关电报频道及“玉衡杯”网站相继关闭,与抓捕时间线高度吻合[https://nga.178.com/read.php?page=e&tid=46277071]。
二、法律依据与入刑标准
- 核心法规:2025年4月“两高”发布《关于办理侵犯知识产权刑事案件适用法律若干问题的解释》[https://www.court.gov.cn/zixun/xingfa/202504/t20250415_4078216.shtml]。
- 入刑条件:通过信息网络传播他人作品、录音录像制品等,满足以下任一条件即涉嫌刑事犯罪:
- 传播数量合计500件(部)以上;
- 被点击数量达到10万次以上[https://mp.weixin.qq.com/s/mglM_ikUWWxzPzxcGJp7GQ]。
- 案件意义:上海首例以刑事手段打击游戏“剧透”行为的案例,此前游戏泄密多通过平台封号、民事诉讼维权,本案标志着刑事打击成为重要手段[http://m.toutiao.com/group/7611425168958685715/?upstream_biz=doubao]。
三、泄密行为的三大危害(米哈游法务总监罗希观点)
- 破坏玩家沉浸式体验:提前泄露碎片化内容,剥夺玩家对未知内容的探索乐趣[https://mp.weixin.qq.com/s/mglM_ikUWWxzPzxcGJp7GQ]。
- 扰乱游戏社区生态:片面信息易引发恶意解读,导致玩家社群误解、争论甚至对立[http://m.toutiao.com/group/7611437307022852642/?upstream_biz=doubao]。
- 造成企业运营损失:打乱新版本宣传节奏,不实信息扩散损害游戏口碑与品牌声誉,本案给米哈游造成实质性损害[https://mp.weixin.qq.com/s/mglM_ikUWWxzPzxcGJp7GQ]。
四、涉案人员认知误区与案件警示
嫌疑人误区:周某等人辩称“仅为游戏爱好者,平台警告后删视频即可,无需承担其他责任”,忽视了刑事犯罪的认定标准[http://m.toutiao.com/group/7611493891327083023/?upstream_biz=doubao]。
行业警示:
- 不仅核心泄密者追责,转载、传播侵权内容也可能构成犯罪;
- 高学历、技术能力不能成为违法借口,游戏测试包破解、未公开内容泄露均受法律约束;
- 文创产业新型犯罪受重点打击,警企直联机制将持续深化[https://mp.weixin.qq.com/s/mglM_ikUWWxzPzxcGJp7GQ]。
OpenAI与美国战争部机密AI部署协议全解析(2026.2.28)
一、协议核心背景与目标
- 合作双方:OpenAI 与美国战争部(DoW,特朗普政府对国防部的称呼)[https://3g.163.com/mobile/article/KMS4QC6D0514R9P4.html]。
- 部署场景:机密环境下的先进AI系统应用,OpenAI 要求政府将相同协议条款开放给所有AI公司。
- 合作初衷:
- 支持美军应对潜在对手的AI技术威胁,提供合规且强大的AI工具。
- 缓和战争部与美国AI实验室的紧张关系(此前Anthropic与政府谈判破裂),推动政府与AI行业深度协作[https://openai.com/index/our-agreement-with-the-department-of-war/]。
- 事件关联:协议达成于特朗普政府下令联邦机构停用Anthropic AI模型数小时后,成为OpenAI在商业与政治层面的重要突破[https://3g.163.com/mobile/article/KMS4QC6D0514R9P4.html]。
二、三大核心安全红线(禁止性条款)
- 严禁大规模国内监控:
- 私人信息处理仅限外国情报目的,遵守《第四修正案》《FISA》《第12333号行政命令》等法规。
- 不得对美国公民进行无约束监控,除《Posse Comitatus Act》(民兵法案)允许的例外情形外,禁止用于国内执法[https://openai.com/index/our-agreement-with-the-department-of-war/]。
- 禁止自主武器系统操控:
- 不得利用OpenAI技术独立指挥需人类控制的自主武器,符合《DoD Directive 3000.09》要求——自主/半自主武器系统必须经严格验证测试,确保人类对武力使用的判断权[http://www.studytimes.cn/dsgs/202508/t20250811_82262.html]。
- 禁止高风险自动化决策:
- 排除“社会信用体系”等涉及高 stakes 的自动化决策场景,此类决策需人类审批[https://openai.com/index/our-agreement-with-the-department-of-war/]。
三、多层级安全保障机制
- 部署架构:仅限云端部署,不提供“无防护”或未经过安全训练的模型,不部署于边缘设备(避免用于致命自主武器)[https://openai.com/index/our-agreement-with-the-department-of-war/]。
- 核心优势:OpenAI 可独立验证红线遵守情况,通过运行和更新分类器实时监控。
- 合同约束:
- 明确AI系统仅用于合法目的,遵守现有法律、操作要求及安全监督协议。
- 引用现行法规固定约束标准,即便未来法律或政策变更,仍需遵循协议签订时的安全标准[https://openai.com/index/our-agreement-with-the-department-of-war/]。
- 专家全程介入:
- 派遣获得许可的OpenAI工程师驻场支持,安全与对齐研究人员全程参与,确保技术使用合规[https://openai.com/index/our-agreement-with-the-department-of-war/]。
- 自主退出权:若政府违反协议条款,OpenAI 可终止合作[https://openai.com/index/our-agreement-with-the-department-of-war/]。
四、与Anthropic的关键差异及立场
- 协议优势:OpenAI 称其协议比Anthropic的谈判条款更具保障性,红线可执行性更强(云端部署+安全栈控制权+人员介入)[https://openai.com/index/our-agreement-with-the-department-of-war/]。
- 核心分歧:Anthropic 因担忧自主武器和国内监控风险,拒绝满足政府“完全开放使用限制”的要求,导致谈判破裂;OpenAI 则通过技术防护+合同约束的方式,在同意“合法用途全覆盖”的同时保留安全管控权[https://3g.163.com/mobile/article/KMS4QC6D0514R9P4.html]。
- OpenAI 立场:明确反对将Anthropic列为“供应链风险”,并呼吁政府与Anthropic解决分歧[https://openai.com/index/our-agreement-with-the-department-of-war/]。
五、行业与法律背景补充
- 自主武器定义:根据《DoD Directive 3000.09》,自主武器系统指无需人为干预即可自主选择并攻击目标的系统,致命性自主武器系统需保留人类决策空间[http://www.studytimes.cn/dsgs/202508/t20250811_82262.html]。
- 国内执法限制:《Posse Comitatus Act》确立“军队原则不承担国内执法”的制度底线,仅国会明确授权时可突破[http://m.toutiao.com/group/7587304693618016810/?upstream_biz=doubao]。
- 行业竞争格局:谷歌、xAI 已与美国国防部签订机密AI合作协议,OpenAI 协议进一步加剧行业在国防领域的协作竞争[https://3g.163.com/mobile/article/KMS4QC6D0514R9P4.html]。
评论
匿名评论隐私政策
✅ 你无需删除空行,直接评论以获取最佳展示效果

