大模型虽强,但在专业领域表现往往不尽如人意。常见的解决方案是通过监督微调或者强化学习更新模型参数,但这背后是高昂的代价与新的局限: 算力黑洞:单次训练动辄消耗数万美元,每一次迭代都是真金白银的投入 ...
年初的 DeepSeek-R1,带来了大模型强化学习(RL)的火爆。无论是数学推理、工具调用,还是多智能体协作,GRPO(Group Relative Policy Optimization)都成了最常见的 RL 算法。GRPO ...
学术与研究:在学术研究和专业领域,Kimi K2 Thinking ...
根据欧盟内部市场、工业、创业和中小企业总司(DG GROW)2024年第一季度数据,受欧盟绿色新政和数字化转型双重影响,CE认证的技术复杂度同比提升38.4%。其中,新增的数字产品护照(DPP)要求使得企业需要准备的可持续性数据量增加67%,而网络安全、人工智能等新兴领域的专项认证需求增长达142%。 中国欧盟商会最新发布的《中欧贸易合规性调研报告》显示,2023年中国企业在CE认证过程中面临的主 ...
当玩具不再沉默,开始理解并回应孩子的每一句话:AI玩具的浪潮正席卷而来。
At the 2025 Baidu World Conference, the spotlight fell once again on the early movers of China’s AI era. Robin Li, Baidu’s founder, used the occasion to underscore a shift that has been quietly reshap ...
这篇博客的主要作者是前 OpenAI 研究员 Kevin Lu,与 Thinking Machines 团队合作完成,他曾领导 GPT-4o mini 发布,并参与了 o1-mini、o3、GPT-5 等多个重要模型的研发。他的出手,分量十足。
一些您可能无法访问的结果已被隐去。
显示无法访问的结果