浙江纺织服装职业技术学院学报杂志
中国期刊全文数据库(CJFD) 中国优秀期刊遴选数据库 中国学术期刊(光盘版)全文收录期刊
主管/主办:宁波市教育局/宁波市教育局
国内刊号:CN:33-1351/Z
国际刊号:ISSN:1674-2346
期刊信息

中文名称:浙江纺织服装职业技术学院学报杂志

刊物语言:中文

刊物规格:A4

主管单位:宁波市教育局

主办单位:宁波市教育局

创刊时间:2002

出版周期:季刊

国内刊号:33-1351/Z

国际刊号:1674-2346

邮发代号:

刊物定价:408.00元/年

出版地:浙江

首页>查看文章

【论文写作技巧】如何高效的选读论文:策略、方法与深度实践

时间:2025-10-24 17:27:13

长久以来,我始终觉得自己在论文阅读方面存在诸多不足。阅读过的论文数量有限,阅读速度也较为缓慢,这让我在获取前沿知识时常常感到力不从心。

记得曾有一位硕士生到偏重研究的组别实习,2019年归来后,他向我反馈:“组里看论文太少,得多读,尤其是最新论文,这样才能紧跟技术发展步伐。”他的观点让我深感认同。在日常教学中,我很少强制学生阅读特定论文,通常只是给一两篇让学生精读,其余则让他们自行探索。然而,我深知自己阅读论文的数量确实过少,近几年更是如此,这无疑导致我获取新信息的渠道变得狭窄。

为了改变这一现状,我给自己设定了一个目标:每天至少花10分钟阅读他人论文。如此一来,一周差不多就能读完一篇论文。我深知,只有坚持这样做,才能长期坚守在科研第一线。毕竟,仅靠听报告和听学生讲解,所获取知识的准确度和深度都远远不够,知识体系也会逐渐老化,最终难以有效指导学生。

剖析阅读困境:读论文少的两大缘由

经过深入自我分析,我发现自己读论文少主要有两个原因。其一,我习惯带着具体问题或想法去搜索相关论文。一方面,我想了解是否有人已做过类似研究,若做过,便进一步分析两者区别是否足够大;另一方面,也希望从中获取更多灵感。其二,我的研究方向相对固定且“狭窄”,近二十年来变化不大,仅做了一些扩展性工作。在这个方向上,技术进展并不迅速,每年值得细细品读的论文并不多。通过浏览论文题目,我大致就能了解大家的研究动态。比如,自2017年Transformer被发明后,NLP领域的进展主要集中在BERT、大模型等通用性方面。

选读论文策略:泛读、精读与极精读

泛读:浅尝辄止,拓宽视野

泛读是对论文的初步了解,可分为不同层次。有的仅读题目,有的读到摘要,有的读到引言部分,有的关注方法,有的则聚焦实验部分。这种阅读通常目的性不强,读不读皆可。若读了,期望能增长知识或对自身工作有所启发,不过后者的可能性或许并不大。

精读:细致剖析,精准把握

精读要求比较细致地阅读论文,达到“能给别人讲清楚”的程度。典型场景是在小组组会上讲解他人论文。基本要求是能讲清楚任务定义、整体框架(big picture)、主要实验结论,并能给出典型例子。对于一些小的技术细节,不必过于纠结;对于不懂的技术,可将其视为黑盒,明白其输入输出即可。

极精读:深度钻研,一劳永逸

极精读是达到完全吃透论文的程度,需搞清楚论文中的大部分内容,包括实验分析,并重新运行作者发布的大部分代码。在以下两种场景下需要极精读论文:一是自己的研究课题中涉及重要方法,以后可能频繁用到,一次性吃透可一劳永逸,既能看懂其他相关论文,也可能从中产生新灵感;二是自己要跟随论文研究方向,在其基础上开展新工作。

在我博士期间,极精读的论文不超过10篇,平均一年也就2篇。当然,这和我看论文总量偏少有关。对于精读的论文,我认为最好一个月精读一篇,并在组会上主动讲解,让老师和其他同学帮助纠正理解错误,同时锻炼自己的讲解能力,这是一种非常理想的状态。

读论文必备:撰写论文笔记

我强烈建议撰写论文笔记。以前我也难以做到,但最近开始培养这个习惯。起因是我在不同场合听一个博士生讲他的工作,包括顶会论文组内预讲、博士开题、中期以及答辩等环节,但每次都没有完全搞透,感觉非常浪费时间。最近,趁这个博士生毕业之前,我跟他讨论了一个小时,然后写了一个“读论文笔记”。写完之后,我感觉彻底搞透了,心里非常清爽。我将论文笔记通过邮件发给自己,同时跟这位博士生确认,又得到了一些反馈,使我的理解更加清晰、准确。

论文笔记有两个显著好处。一是快速回忆:每个人都有自己的知识体系和表达习惯,用自己的话写出笔记后,以后就可以利用这个笔记很快地回忆起论文内容。二是增量式学习:基于此可以继续看论文、进行讨论,从而加深理解。这是一个渐变的过程,逐渐加深理解可以持续进行,有效避免了“从头再来、浪费时间、浪费脑细胞”的问题。

写论文笔记也分为几个层次,后两个层次对应的是真正的“论文笔记”,需要保留好。一是随手记:我一般用一个word文档,复制粘贴文字、截图,并写下自己的理解。有时候我还会吐槽一番,表达对作者的不满,这样读论文的参与感更强,就像一个法官在评判一篇论文。二是以后自己看:比较系统地记录,只保留重要内容。我通常是给自己发邮件,由于是给自己看的,所以格式、语言可以随意一些,花费的时间不会太多。三是公开发表“论文笔记”:比如在公众号上发一个读论文笔记。正式发表的笔记和“以后自己看的笔记”相比,所花费的时间要多很多,需要成体系地讲述,要讲清楚背景,并且要考虑别人是否能看懂。

“论文笔记”里应包含两方面重要内容。第一方面是梳理出整体框架(big picture)。我之前讲过big picture也是分层的,有最高层的big picture,还有第二层中每一个组块的big picture等。第二方面是只要自己花时间(哪怕只是几分钟)才搞清楚的东西,比如数学符号的定义等,都要写出来,这样可以避免以后自己重复思考。每个人的知识体系和表达方式不同,这个过程本质上就是把别人的知识映射到自己的知识体系上,相当重要。

说到这里,我认为如果一篇论文值得精读,那么一定要直接去看论文原文,而不能通过读其他人的“公众号文章”来了解。因为原汁原味的内容最好,“论文解读者”对论文工作的理解一般都不如论文作者深刻,最终还是要看论文原文,否则就相当于接触了两套“知识体系和表达方式”,增加了理解的负担。

与论文相遇:多种方式任你选

订阅追踪,及时获取

订阅某些人的google scholar账号,一旦其发表新论文,都会通过邮件发送给自己,这样就能及时了解最新研究成果。

个性推荐,精准匹配

建立自己的google scholar账号,每次访问https://scholar.google.com/时,首页就会根据你已发表的论文推荐相关论文,实现个性化推荐。

逛街式阅读,广泛涉猎

逛街式读论文,比如参加一个会议、浏览一个会议论文集发布(proceedings)或者一个期刊发布新的一期内容。在我们NLP领域,建了一个acl anthology网站,包括了绝大部分会议的论文集,非常实用。逛街式读论文时,也可以根据关键词进行搜索。

审稿接触,深入了解

通过审稿来接触和了解新的论文,在审稿过程中可以深入研读论文,提出自己的见解和建议。

相遇之后:分层阅读,循序渐进

和一篇论文见面后,可以按照以下方式阅读。一是只读题目(title):对于大部分论文来说,只需要读题目就可以排除大部分不符合自己兴趣的论文,比如不感兴趣的主题、不认可的方法可行性等。二是只读摘要:读完题目后感觉挺有意思的,可以继续读摘要。读完摘要后了解得更多一些,此时如果觉得没有必要继续读下去就可以停止了。三是读到引言:读完摘要后还想了解更多的内容,引言部分是摘要的扩写版。四是读完方法或实验:这基本就达到精读的程度了,此时就该写论文笔记了。

每向前迈进一步都要慎重考虑,别贪多求全,对个人而言,绝大部分论文都是可读可不读的。读论文和“识人、阅人、鉴人”类似,一方面要讲缘分,另一方面要细水长流、一点一点深入下去,这样最省能量,即性价比最高。

高效阅读:带着目的,精准出击

除了“极精读”的论文外,其他论文都没必要完全读透,通常只需要搞清楚最重要的一个方面或者几个方面即可。那么哪个(哪些)方面需要搞透呢?当然是感兴趣的、相关的方面了。带着问题去读论文,效率会高很多。和问题相关的内容我会重点关注,其他的只要不影响我理解“关注的内容”就可以略过了。

所以读论文时要给自己提问题:我为什么对这篇论文感兴趣?我最想搞清楚哪部分内容?别贪心求全。好的论文你是会读多遍的,每读一遍你的关注点都可能会有所变化,要细水长流、一点一点深入下去。

举个例子,我有一个想法(idea),我想知道要读的这篇论文是否已经做过了类似的研究,以及和我的想法有什么异同之处。这篇论文可能有2个贡献点,但其中只有1个和我的想法相关,那么我可能只需要重点关注和我的问题相关的部分就可以了,这样阅读起来就会快很多。

时间会给出答案,一篇论文是否真的紧密相关、是否需要读多遍等问题都会随着时间的推移而逐渐明朗化,别急躁。

精读判断:兴趣、方法与开源

如何判断一篇论文是否值得精读呢?最关键的是要看是否感兴趣、是否有趣味性。简单就是美,如果论文提出的方法很复杂,我一般会选择退避三舍。

如果一篇论文有开源代码(比如在github上),并且别人提问题(issue)时能够得到比较及时的回复,同时代码也在持续维护中,那么这样的论文特别值得精读。因为如果你肯花时间的话,肯定能完全搞明白。处于这个开源的时代,我们真的很幸福,10年以前(即深度学习时代之前)还不是这样的呢。

认识的人的工作也值得精读,因为你有问题可以随时问(通过邮件、语音或者当面交流)。同一个小组的、同一个大课题组的、同一个学校的都有先天优势。参加会议时听报告之后踊跃提问,没问清楚再约着继续问,这是非常好的“深度结识”别人的方式,慢慢地了解会越来越多、友谊会越来越深。好朋友之间可能十几分钟电话就把一篇文章完全搞明白了(还包括一些没有写出来的缺点)。

作者的声誉是一切的基础,声誉不好的人的工作要谨慎跟随(follow)。但是也不能随意地就给别人贴上不好的标签,人云亦云很容易产生偏见,要有具体的证据才行。

科研新手:精读为主,打牢基础

昨天一位苏大本科生发邮件问我一些做科研的问题,其中一个焦点就是如何读论文。科研新手距离科研入门还很远,他们大概率自己想不出好的想法(idea),我觉得他们主要得靠老师给具体的想法(idea),至少是要和老师一起讨论出想法(idea)才行。

科研新手最重要的任务是打基础,如果在做具体的想法(idea),那么在做想法(idea)的过程中很大比例也是在打基础。打基础就是透彻理解一些知识、自己动手实现一些技术、自己动手去分析数据(理解任务)。

科研新手读论文一定是以“精读”、“极精读”为主,泛读的意义很小,不要妄想通过泛读论文来想出想法(idea)。科研新手泛读论文通常都读不懂,有时候自己觉得自己读懂了其实大概率是误解了。科研新手泛读论文还有个很大的弊端,觉得好想法(idea)都被别人做完了,总觉得别人的工作很高大上、遥不可及(其实很多工作只是表面光鲜),从而失去信心、热情。

只有精读才能较准确地理解论文内容,才能比较真实地看待一个工作,才可能看到这个工作的缺点(绝大部分工作都有明显缺点),才可能把这个工作的想法和技术借鉴到未来的工作中(即融入到自己的知识体系中)。

搞清楚一篇论文、搞透一个技术,然后以此为支点继续去搞懂其他的论文和技术,慢慢地知识体系就建立起来了,也会越来越有信心、兴趣去做科研了。科研新手自己是最重要的因素,但好的指导老师当然也很关键。

其他素材与杂想

论文数量繁多,精读跟自己的想法(idea)相关的论文就可以了。非常有趣的、简单的、经典的论文(比如最大熵、CRF、Transformer)都值得精读,有点像读书、学数学的过程,本质上是打基础。

带着问题读论文,别想着完全读透(有的实验结论会夸大其词,只有精读的才需要特别细致地看)。调研一个研究方向时(比如PM2.5),第一阶段应该是看大家都在做什么任务、任务定义是什么、模型输入输出以及评价标准等;模型的具体工作原理应该是第二阶段才看的。因为通过任务定义可能就会把一些论文排除在外了。

带着问题去读论文效率最高,和问题无关的内容可以不细看。一篇好文章可能需要看很多遍才能完全理解,看的时候关注点不同收获也不同。不要想着把一篇文章完全读透然后再产生自己的想法(idea),靠这种方式想出想法(idea)的成功概率太低了。完全吃透一篇论文需要很久很久的时间,或者说需要精读的论文并不多。把能读懂、需要读懂的地方读懂就可以了,其他的知道自己还没读懂也很重要,不能糊里糊涂地读论文。要明白自己想搞清楚论文中的哪部分内容,是方法、实验结论还是实验分析。

品味老论文也是一种乐趣,senior学者、有经验的研究者不时读一些老论文,看老论文中的一些观点、讨论以及点评等内容时会产生共鸣,会感觉以前的研究者其实都想到了很好的点子(idea)和角度,也会感叹技术进展的快速和缓慢。