在2025年,随着学术写作智能化的浪潮席卷而来,使用AI写论文的工具的人越来越多。当面临撰写硕士和博士论文这样的长篇论文时,很多工具往往无法满足学术需求。这些AI论文写作工具在理论深度上有所欠缺,逻辑结构也常常显得松散,难以真正解决专业领域的写作问题 ...
为了打破这种「高分幻觉」,来自北京航空航天大学的研究团队提出了一种全新的基准构建哲学 ——双重扩展(Dual Scaling),并基于此构建了端到端的自动化框架Code2Bench。该研究旨在为代码大模型的评估,建立一个更动态、更严苛、也更具诊断性的新范式。