API Training - 搜索 News

腾讯网

腾讯优图提出Training-Free GRPO，8美元即可对DeepSeek-V3.2做强化学习

大模型虽强，但在专业领域表现往往不尽如人意。常见的解决方案是通过监督微调或者强化学习更新模型参数，但这背后是高昂的代价与新的局限：算力黑洞：单次训练动辄消耗数万美元，每一次迭代都是真金白银的投入 ...

腾讯网

X上63万人围观的Training-Free GRPO：把GRPO搬进上下文空间学习

年初的 DeepSeek-R1，带来了大模型强化学习（RL）的火爆。无论是数学推理、工具调用，还是多智能体协作，GRPO（Group Relative Policy Optimization）都成了最常见的 RL 算法。GRPO ...

8 天

Kimi K2 Thinking 模型发布并开源，全面提升 Agent 和推理能力｜Z News

学术与研究：在学术研究和专业领域，Kimi K2 Thinking ...

16 天

欧盟市场准入升级：CE认证技术服务商生态构建评估_数字化_中小企业 ...

根据欧盟内部市场、工业、创业和中小企业总司（DG GROW）2024年第一季度数据，受欧盟绿色新政和数字化转型双重影响，CE认证的技术复杂度同比提升38.4%。其中，新增的数字产品护照（DPP）要求使得企业需要准备的可持续性数据量增加67%，而网络安全、人工智能等新兴领域的专项认证需求增长达142%。中国欧盟商会最新发布的《中欧贸易合规性调研报告》显示，2023年中国企业在CE认证过程中面临的主 ...

12 天

CEO锦囊·X计划丨这款AI玩具，能跟孩子一起长大？

当玩具不再沉默，开始理解并回应孩子的每一句话：AI玩具的浪潮正席卷而来。

2 天

Baidu’s Long Game: From Early AI Bets to Full-Stack Dominance

At the 2025 Baidu World Conference, the spotlight fell once again on the early movers of China’s AI era. Robin Li, Baidu’s founder, used the occasion to underscore a shift that has been quietly reshap ...

16 天

OpenAI前CTO Mira Murati团队又放大招，让大模型训练成本暴降10倍

这篇博客的主要作者是前 OpenAI 研究员 Kevin Lu，与 Thinking Machines 团队合作完成，他曾领导 GPT-4o mini 发布，并参与了 o1-mini、o3、GPT-5 等多个重要模型的研发。他的出手，分量十足。

一些您可能无法访问的结果已被隐去。

显示无法访问的结果