985博士耗时4年“打假”:领域内“开山之作”是瞎编的?
文|《中国科学报》记者 徐可莹
“真相只有一个”,这是陈路最爱的动漫《名侦探柯南》中的一句标志性台词。上百集的番剧,陈路刷过不止一遍,连微信头像都换成了主人公“新一”。他是个不那么典型的“二次元”,酷爱日本动漫,但性格安静、内向,骨子里有点“理想主义”。
2022年9月,还在中国人民大学信息学院读博二的陈路在知乎上讲了个故事,充满戏剧性——他研究了4年的一篇领域内“开山”级论文竟然是“假”的。
起初,这篇帖子并未引起多少关注,直到陈路的复现报告被ICASSP2023接收。一大批网友涌入这片原本无人问津的评论区,竖起大拇指。原帖还被一些微博大V、知名公众号转载。至此,这个颇具荒诞色彩的“打假”故事才被更多人了解:
一篇源自世界顶尖名校麻省理工学院(MIT)的领域内“开山之作”被质疑造假。而举起这把长矛的人,正是名不见经传的陈路——一位自称“资质平庸”的二次元“土博”。
“该不会是假的吧”
当质疑的念头第一次出现在脑海,陈路甚至有些不自信。那是2020年秋天的一个深夜,读博3个月的陈路丧气地躺在床上,望着天花板。硕士毕业一年后,他放弃了一份国字头的“铁饭碗”和马上到手的北京户口,破釜沉舟般地回到人大继续读博。
由于和硕士阶段是同一位指导老师,陈路很自然地捡起了那时未完成的项目。2018年6月,研一即将结束,陈路的导师让他去研究一个名为“语音向量”的前沿领域。该领域的“开山之作”于2017年问世,第一作者是来自MIT的Yu-An Chung,后者曾是台湾大学知名教授李宏毅的学生。
微软亚洲研究院。受访者供图
在整个过程中,还出现过一个宿命般的小插曲。2023年6月,陈路的文章被ICASSP2023接收后,曾收到过一封来自台湾的邮件。
对方自称是台湾大学李宏毅教授实验室的一名学生。他向陈路透露,他们实验室有好几位同学都曾尝试复现过Yu-An Chung的那篇论文研究过程,皆一无所获,甚至还有一人因此差点毕不了业。陈路的文章发表后,实验室有同学将他的文章放入meeting的排程中,李宏毅本人还为此写下“这篇太劲爆了!一定要有人来讲一下”的批注。同学讲解完毕后,李宏毅还激动地表示他曾经也复现失败,有很多人因此受害等。
“您的文章让我们实验室为之震撼,我们很佩服您有这样的勇气与决心通过完整实验将整件事情公诸于世。”对方在邮件中写道。
陈路回复:“我现在感觉,这篇文章还是有意义的。”
没错。因为,真相比一切都重要。
(文中陈路为化名)