它是由全球近千名专家联合打造的《Humanity’s Last Exam》(HLE)被誉为“人类最后一场闭卷考试”。包含了3000道高难度题目的多模态基准测试,不仅挑战AI的极限,更试图为技术发展轨迹与风险治理提供关键标尺。