site:www.51cto.com - 搜索 News

4 小时

谷歌造出AI数学家，48%碾压全场！牛津教授用它破解60年未解之谜

在Epoch AI组织的FrontierMath Tier 4基准测试中（50道由教授和博后专门设计的「短期科研项目」级别超难题，专业数学家也得花上数天乃至数周），AI ...

怎么判断大模型是真懂还是假懂？浙大x爱丁堡大学新指标NCB：给它的 ...

如果一个模型原本知道正确答案，当持续学习过程中的上下文里出现错误信息时，它还能坚持正确判断吗？当大模型看起来很自信时，它真的“相信”自己说的话吗？最近，大模型Agent越来越多地被放进复杂的harness系统里。它不再只是回答一个孤立问题，而是 ...

51CTO

打造持续可靠的AI工程：Harness Engineering实践

本文系统性地介绍了 Harness Engineering 的四大实践，并通过 pet_app 项目展示了具体的落地方法。每个理论背后都有对应的 md 文档作为支撑：AGENTS.md、PROGRESS.md、DECISIONS.md、TASKS.md等。这些文档构成了 Harness 的完整形态。你一定见过这样的情况——Claude Pro 订阅着 ...

51CTO

比 pnpm 快六倍！这款新工具到底什么来头？

Pnpm 已经够快了，Bun 已经够激进了，没想到 Aube 直接把速度上限又拉高了一个档次。还在纠结 npm、yarn、pnpm、Bun 谁更快？前端包管理器赛道，又杀出一匹超级黑马！由 Mise 原作者全新打造的 Node.js 包管理器 —— Aube 正式亮相。不靠花哨功能、不堆冗余特性 ...

51CTO

国产 AI 开发工具混战：Trae、Qoder、CodeBuddy、WorkBuddy，谁更像下一代 ...

现在的 AI 开发工具，已经不再满足于帮你补一行代码。它们想理解一个项目，拆解一个需求，生成一个计划，修改多个文件，调用终端，打开浏览器，运行测试，修复报错，甚至把一个产品从想法推进到可预览、可部署、可交付的状态。从代码补全到自主交付 ...

51CTO

X上爆火！Anthropic工程师力荐：AI输出别用Markdown了，HTML才是yyds

今天就带大家拆解这位工程师的干货分享，看完你会发现：原来AI输出还能这么高效、清爽，打工人直接省出一半时间！Thariq在分享中坦言，Markdown确实简单、易编辑，甚至Claude都能熟练用ASCII在Markdown里画图表，但随着AI能力越来越强，Markdown的局限性也越来越 ...

1 天

谷歌「AI联合数学家」来了！刷新最难数学AI基准SOTA，牛津教授用它 ...

GPT-5.5 Pro此前在Tier 4拿到39.6%，GPT-5.4 Pro是37.5%，Claude Opus 4.6/4.7则双双落在22.9%。

2 天

OpenAI翁家翌：梯度之外，下一个AI训练范式有着落了？

Continual Learning 一直难以被解决，主要卡在神经网络的灾难性遗忘：学了新东西，旧能力就容易被冲掉。那如果不把目光只放在神经网络权重上，还有没有其他解决方案？如果有一天，一段由 AI 编程工具写的纯粹的程序代码 —— ...

51CTO

马斯克解散xAI，22万张GPU全送给Claude，为了绞杀OpenAI他真拼了！

Anthropic拿着Claude捡了个天大的便宜。在OpenAI步步紧逼的当下，瞬间吃下孟菲斯那22万张GPU的海量真实算力。可以预见，Claude的代码能力和可用性马上就要迎来一波恐怖的跃升，曾经的“限流王者”现在彻底有了掀桌子的底气。近期5月7日，埃隆·马斯克在X平台上 ...

51CTO

Claude Code之父重磅访谈：不写一行代码，手机指挥上千Agent干活

未来的软件世界没有一行代码，只有无数个精准表达的想法在云端永不休眠地运转。红杉资本主办的AI Ascent 2026，召集了Greg Brockman、Andrej Karpathy、Demis Hassabis、Boris Cherny、Dmitri Dolgov等150多名全球顶级创始人或研究人员，讨论前沿科技与未来。最新一期访谈 ...

51CTO

从 Copy Fail 到 Dirty Frag：Linux 内核「页缓存写」漏洞类的连环披露

Copy Fail 和 Dirty Frag 的同周披露不是巧合，但也不是同一团队协调的产物。两条线独立行进，最后撞到一起。 2026 年 4 月 29 日到 5 月 8 日，仅九天时间，Linux 内核同一类逻辑漏洞——通过 splice() 把只读文件的页缓存页种进 zero-copy 发送路径，让接收侧的 in-place ...

1 天

量子点芯片新思路：打造可移动的量子比特

量子点（Quantum dot）属于前一种路线。它把单个电子困在极小空间里，并用电子自旋承载量子比特。由于量子点尺寸小，可以高密度集成进芯片，并兼容现有芯片制造工艺，因此更有机会做出大规模器件。

一些您可能无法访问的结果已被隐去。

显示无法访问的结果