这项由上海财经大学的陆雨晨、杨润、张艺晨、俞曙光等多位研究者领导的研究团队发表于2025年10月的arXiv预印本平台(论文编号:arXiv:2510.09517v1),感兴趣的读者可以通过该编号查询完整论文。这个研究团队创造了一个全新的评测体系,专门用来检验AI模型在统计学方面的推理能力,就像为AI设计了一场统计学的"高考"。