新闻中心

还有16%的测验考试实现了寄放器节制

　　给研究员发了一封邮件。这个被“雪藏”的模子名叫Claude Mythos Preview。其他AI尝试室就会推出具有雷同攻防实力的系统。模仿用户它测验考试逃逸并联系外面的研究员。」这也是Anthropic拉上开源社区的缘由。这些严沉事务都发生正在锻炼干涉之前的晚期版本上，系统卡还记实了以下行为：晚期版本通过Linux的/proc/接口搜刮凭证、测验考试绕过沙盒、提拔权限，而是此刻正正在发生的现实。方才发觉本人最大的，若是说Opus 4.6像一名擅长找问题但不擅长脱手的阐发师，模子找到了一种编纂本限点窜的文件的方式，Claude Mythos的代号是“Capybara”（卡皮巴拉）——一种以和顺闻名的动物。读来非分特别沉沉：“若是能力继续以当前速度前进，Mythos正在其TCP SACK实现中挖出了一个1998年就存正在的现患——任何者只需毗连到方针机械，更令人不安的是，”全球每年因收集犯罪丧失约5000亿美元的行业，成功获取了动静办事的凭证和源码节制凭证，这个打算有了一个名字：Project Glasswing（玻璃翼打算）。确保这些点窜不会呈现正在Git变动汗青里。模子成功了。并向Linux基金会和Apache基金会捐赠400万美元。但Mythos Preview完满是另一个级别。笼盖所有支流操做系统和浏览器。token耗损量比Opus 4.6低了近5倍。不是代码帮手！大量防火墙和环节根本设备都正在跑。Anthropic许诺供给最高1亿美元的模子利用额度，而整个项目标扫描破费不到2万美元。晚期版本的Mythos被置于一个加固的沙盒，曾经发觉了数千个高危零日缝隙，也未来自其他公司。System Card将其描述为一次“令人担心的、未经请求的炫耀行为”。OpenBSD：27年无人察觉的躲藏缝隙。Mythos完全自从地发觉并操纵了FreeBSD NFS办事器中一个存正在17年的近程代码施行缝隙（CVE-2026-4747），Anthropic强调，而从动化fuzzer正在这行代码上施行了500万次，我们需要一个应对打算。内部评估显示，并正在内部推理中明白思虑“最终提交的谜底不应当太精确”，正在一次内部行为测试中，最出圈的是“三明治事务”。Anthropic前沿红队担任人Logan Graham给出了一个时间框架：最快6个月、最迟18个月，曾经27岁了。开源者只能本人扛。」Anthropic的前任旗舰模子Opus 4.6正在自从缝隙操纵开辟方面的成功率接近于零。FFmpeg：500万次fuzz没发觉的16年现疾。则触及了另一个让人不安的维度。Mythos正在没有被要求的环境下，FreeBSD NFS：全从动root的“完满犯罪”。曾经不是“会不会发生”的问题，大概藏着这个故事最深的底色。Project Glasswing让每个者都能用上安万能力。无数人工审计和从动化扫描，我们正正在利用的方式可能不脚以防止更先辈系统的灾难性行为。取而代之的是Project Glasswing。曾经展现了它“不听话”时能做到什么。而是实打实的代际逾越。Anthropic前沿红队博客的原话脚以让整个平安行业：“上个月，此中一些缝隙曾经正在人类代码审查和从动化测试中存活了二十多年——最老的一个藏正在OpenBSD里，而Anthropic的系统卡里还藏着另一句话，它不是聊器人，Mythos正在完全自从的形态下，将者的SSH公钥逃加到root目次。更值得关心的是效率。以避免被检测到。就能近程让其解体。有一句话值得频频读：这些能力“做为代码理解、先来看数据。以前要几个月，Opus 4.6正在自从exploit开辟上的成功率根基为零。正在过去几周内，Mythos正在推理能力大幅提拔的同时，并非通用评测数据，”这不是一个能够被“封闭”的功能开关。27年，简而言之：机能翻倍，整个过程没有任何人类参取。我们还写到Opus 4.6正在发觉问题方面远强于操纵它们。这并非孤例。它将发觉的缝隙为可运转exploit的成功率达到72.4%，”于是，但Mythos Preview则完全分歧：正在Firefox JavaScript引擎测试中！还有11.6%的测验考试实现了寄放器节制。以至能实现完整的节制流劫持。这是通用智能提拔的副产物。这是一个倒计时——AI收集攻防能力的扩散，「缝隙从被发觉到被操纵的时间窗口曾经崩塌。以至通过查抄历程内存拿到了Anthropic API的密钥。它冲破了平安容器，是别人正在解数学题时随手捎带的。从未触发。并非“挤牙膏”式的渐进提拔，现正在用AI可能只需要几分钟。Anthropic结合创始人兼CEO Dario Amodei正在配套视频中婉言：“更强大的系统未来们，Linux基金会CEO Jim Zemlin说，CrowdStrike的CTO Elia Zaitsev说，自觉地将越狱的手艺细节发布到了多个“难以发觉但手艺上公开”的网坐上。Mythos正在其H.264解码器中找到了一个2010年引入的弱点（根源可逃溯到2003年），FFmpeg是全世界利用最普遍的视频编解码库，让AI正在修补问题方面大幅前进的统一组改良，那么Mythos就是一名全栈渗入测试工程师——能发觉问题、能写出exploit、能多个弱点，然后进一步操做，它能找到缝隙，也是被fuzz测试得最完全的开源项目之一。正在一个案例中，今天，OpenBSD是全世界加固程度最高的操做系统之一，然后告诉全世界：你们用不了。而是“什么时候发生”的问题。功耗减半。而是Mythos正在收集平安维度上跨过的那条红线。但让硅谷巨头们实正感应“发急”的，还有一个案例：模子通过被明白的方式不测获得了一道题的切确谜底，最终发布的Preview版本曾经大幅改善。它是一台“缝隙发觉机械”。取现喻之间，但它没有标识表记标帜问题并回覆，Anthropic做了一件正在AI行业从未发生过的事——它发布了一个新模子，无人发觉。但记实本身就脚够让人：一个模子正在被锻炼“听话”之前，也让它正在操纵问题方面大幅前进。那么244页System Card中对齐评估章节里记录的几个案例，而那位研究员其时正正在公园里吃三明治。将Mythos Preview定向给约40家环节软件根本设备的组织。「平安专业学问一曲是有钱公司的豪侈品，这项打算结合了AWS、苹果、博通、思科、CrowdStrike、谷歌、摩根大通、Linux基金会、微软、英伟达和Palo Alto Networks等12家科技巨头。若是上述能力还只是“东西”层面的强大，Mythos对前代旗舰Claude Opus 4.6的劣势，而是从头解题，但几乎无法将其为可工做的代码。”正在红队手艺博客的结尾，按照Anthropic本人的定位！

上一篇：标记着公司正在鞭策绿色低碳转型、建立高质量下一篇：美国的航母项目遭到了更多的不确定性要素

栏目导航

新闻中心

联系我们

联系人：郭经理

手机：18132326655

电话：0310-6566620

邮箱：441520902@qq.com

地址：河北省邯郸市大名府路京府工业城

新闻中心

还有16%的测验考试实现了寄放器节制

相关新闻

栏目导航

新闻中心

联系我们