【论文写作技巧】如何高效的选读论文：策略、方法与深度实践

时间：2025-10-24 17:27:13

长久以来，我始终觉得自己在论文阅读方面存在诸多不足。阅读过的论文数量有限，阅读速度也较为缓慢，这让我在获取前沿知识时常常感到力不从心。

记得曾有一位硕士生到偏重研究的组别实习，2019年归来后，他向我反馈：“组里看论文太少，得多读，尤其是最新论文，这样才能紧跟技术发展步伐。”他的观点让我深感认同。在日常教学中，我很少强制学生阅读特定论文，通常只是给一两篇让学生精读，其余则让他们自行探索。然而，我深知自己阅读论文的数量确实过少，近几年更是如此，这无疑导致我获取新信息的渠道变得狭窄。

为了改变这一现状，我给自己设定了一个目标：每天至少花10分钟阅读他人论文。如此一来，一周差不多就能读完一篇论文。我深知，只有坚持这样做，才能长期坚守在科研第一线。毕竟，仅靠听报告和听学生讲解，所获取知识的准确度和深度都远远不够，知识体系也会逐渐老化，最终难以有效指导学生。

剖析阅读困境：读论文少的两大缘由

经过深入自我分析，我发现自己读论文少主要有两个原因。其一，我习惯带着具体问题或想法去搜索相关论文。一方面，我想了解是否有人已做过类似研究，若做过，便进一步分析两者区别是否足够大；另一方面，也希望从中获取更多灵感。其二，我的研究方向相对固定且“狭窄”，近二十年来变化不大，仅做了一些扩展性工作。在这个方向上，技术进展并不迅速，每年值得细细品读的论文并不多。通过浏览论文题目，我大致就能了解大家的研究动态。比如，自2017年Transformer被发明后，NLP领域的进展主要集中在BERT、大模型等通用性方面。

选读论文策略：泛读、精读与极精读

泛读：浅尝辄止，拓宽视野

泛读是对论文的初步了解，可分为不同层次。有的仅读题目，有的读到摘要，有的读到引言部分，有的关注方法，有的则聚焦实验部分。这种阅读通常目的性不强，读不读皆可。若读了，期望能增长知识或对自身工作有所启发，不过后者的可能性或许并不大。

精读：细致剖析，精准把握

精读要求比较细致地阅读论文，达到“能给别人讲清楚”的程度。典型场景是在小组组会上讲解他人论文。基本要求是能讲清楚任务定义、整体框架（big picture）、主要实验结论，并能给出典型例子。对于一些小的技术细节，不必过于纠结；对于不懂的技术，可将其视为黑盒，明白其输入输出即可。

极精读：深度钻研，一劳永逸

极精读是达到完全吃透论文的程度，需搞清楚论文中的大部分内容，包括实验分析，并重新运行作者发布的大部分代码。在以下两种场景下需要极精读论文：一是自己的研究课题中涉及重要方法，以后可能频繁用到，一次性吃透可一劳永逸，既能看懂其他相关论文，也可能从中产生新灵感；二是自己要跟随论文研究方向，在其基础上开展新工作。

在我博士期间，极精读的论文不超过10篇，平均一年也就2篇。当然，这和我看论文总量偏少有关。对于精读的论文，我认为最好一个月精读一篇，并在组会上主动讲解，让老师和其他同学帮助纠正理解错误，同时锻炼自己的讲解能力，这是一种非常理想的状态。

读论文必备：撰写论文笔记

我强烈建议撰写论文笔记。以前我也难以做到，但最近开始培养这个习惯。起因是我在不同场合听一个博士生讲他的工作，包括顶会论文组内预讲、博士开题、中期以及答辩等环节，但每次都没有完全搞透，感觉非常浪费时间。最近，趁这个博士生毕业之前，我跟他讨论了一个小时，然后写了一个“读论文笔记”。写完之后，我感觉彻底搞透了，心里非常清爽。我将论文笔记通过邮件发给自己，同时跟这位博士生确认，又得到了一些反馈，使我的理解更加清晰、准确。

论文笔记有两个显著好处。一是快速回忆：每个人都有自己的知识体系和表达习惯，用自己的话写出笔记后，以后就可以利用这个笔记很快地回忆起论文内容。二是增量式学习：基于此可以继续看论文、进行讨论，从而加深理解。这是一个渐变的过程，逐渐加深理解可以持续进行，有效避免了“从头再来、浪费时间、浪费脑细胞”的问题。

写论文笔记也分为几个层次，后两个层次对应的是真正的“论文笔记”，需要保留好。一是随手记：我一般用一个word文档，复制粘贴文字、截图，并写下自己的理解。有时候我还会吐槽一番，表达对作者的不满，这样读论文的参与感更强，就像一个法官在评判一篇论文。二是以后自己看：比较系统地记录，只保留重要内容。我通常是给自己发邮件，由于是给自己看的，所以格式、语言可以随意一些，花费的时间不会太多。三是公开发表“论文笔记”：比如在公众号上发一个读论文笔记。正式发表的笔记和“以后自己看的笔记”相比，所花费的时间要多很多，需要成体系地讲述，要讲清楚背景，并且要考虑别人是否能看懂。

“论文笔记”里应包含两方面重要内容。第一方面是梳理出整体框架（big picture）。我之前讲过big picture也是分层的，有最高层的big picture，还有第二层中每一个组块的big picture等。第二方面是只要自己花时间（哪怕只是几分钟）才搞清楚的东西，比如数学符号的定义等，都要写出来，这样可以避免以后自己重复思考。每个人的知识体系和表达方式不同，这个过程本质上就是把别人的知识映射到自己的知识体系上，相当重要。

说到这里，我认为如果一篇论文值得精读，那么一定要直接去看论文原文，而不能通过读其他人的“公众号文章”来了解。因为原汁原味的内容最好，“论文解读者”对论文工作的理解一般都不如论文作者深刻，最终还是要看论文原文，否则就相当于接触了两套“知识体系和表达方式”，增加了理解的负担。

与论文相遇：多种方式任你选

订阅追踪，及时获取

订阅某些人的google scholar账号，一旦其发表新论文，都会通过邮件发送给自己，这样就能及时了解最新研究成果。

逛街式阅读，广泛涉猎

逛街式读论文，比如参加一个会议、浏览一个会议论文集发布（proceedings）或者一个期刊发布新的一期内容。在我们NLP领域，建了一个acl anthology网站，包括了绝大部分会议的论文集，非常实用。逛街式读论文时，也可以根据关键词进行搜索。

审稿接触，深入了解

通过审稿来接触和了解新的论文，在审稿过程中可以深入研读论文，提出自己的见解和建议。

相遇之后：分层阅读，循序渐进

和一篇论文见面后，可以按照以下方式阅读。一是只读题目（title）：对于大部分论文来说，只需要读题目就可以排除大部分不符合自己兴趣的论文，比如不感兴趣的主题、不认可的方法可行性等。二是只读摘要：读完题目后感觉挺有意思的，可以继续读摘要。读完摘要后了解得更多一些，此时如果觉得没有必要继续读下去就可以停止了。三是读到引言：读完摘要后还想了解更多的内容，引言部分是摘要的扩写版。四是读完方法或实验：这基本就达到精读的程度了，此时就该写论文笔记了。

每向前迈进一步都要慎重考虑，别贪多求全，对个人而言，绝大部分论文都是可读可不读的。读论文和“识人、阅人、鉴人”类似，一方面要讲缘分，另一方面要细水长流、一点一点深入下去，这样最省能量，即性价比最高。

高效阅读：带着目的，精准出击

除了“极精读”的论文外，其他论文都没必要完全读透，通常只需要搞清楚最重要的一个方面或者几个方面即可。那么哪个（哪些）方面需要搞透呢？当然是感兴趣的、相关的方面了。带着问题去读论文，效率会高很多。和问题相关的内容我会重点关注，其他的只要不影响我理解“关注的内容”就可以略过了。

所以读论文时要给自己提问题：我为什么对这篇论文感兴趣？我最想搞清楚哪部分内容？别贪心求全。好的论文你是会读多遍的，每读一遍你的关注点都可能会有所变化，要细水长流、一点一点深入下去。

举个例子，我有一个想法（idea），我想知道要读的这篇论文是否已经做过了类似的研究，以及和我的想法有什么异同之处。这篇论文可能有2个贡献点，但其中只有1个和我的想法相关，那么我可能只需要重点关注和我的问题相关的部分就可以了，这样阅读起来就会快很多。

时间会给出答案，一篇论文是否真的紧密相关、是否需要读多遍等问题都会随着时间的推移而逐渐明朗化，别急躁。

精读判断：兴趣、方法与开源

如何判断一篇论文是否值得精读呢？最关键的是要看是否感兴趣、是否有趣味性。简单就是美，如果论文提出的方法很复杂，我一般会选择退避三舍。

如果一篇论文有开源代码（比如在github上），并且别人提问题（issue）时能够得到比较及时的回复，同时代码也在持续维护中，那么这样的论文特别值得精读。因为如果你肯花时间的话，肯定能完全搞明白。处于这个开源的时代，我们真的很幸福，10年以前（即深度学习时代之前）还不是这样的呢。

认识的人的工作也值得精读，因为你有问题可以随时问（通过邮件、语音或者当面交流）。同一个小组的、同一个大课题组的、同一个学校的都有先天优势。参加会议时听报告之后踊跃提问，没问清楚再约着继续问，这是非常好的“深度结识”别人的方式，慢慢地了解会越来越多、友谊会越来越深。好朋友之间可能十几分钟电话就把一篇文章完全搞明白了（还包括一些没有写出来的缺点）。

作者的声誉是一切的基础，声誉不好的人的工作要谨慎跟随（follow）。但是也不能随意地就给别人贴上不好的标签，人云亦云很容易产生偏见，要有具体的证据才行。

科研新手：精读为主，打牢基础

昨天一位苏大本科生发邮件问我一些做科研的问题，其中一个焦点就是如何读论文。科研新手距离科研入门还很远，他们大概率自己想不出好的想法（idea），我觉得他们主要得靠老师给具体的想法（idea），至少是要和老师一起讨论出想法（idea）才行。

科研新手最重要的任务是打基础，如果在做具体的想法（idea），那么在做想法（idea）的过程中很大比例也是在打基础。打基础就是透彻理解一些知识、自己动手实现一些技术、自己动手去分析数据（理解任务）。

科研新手读论文一定是以“精读”、“极精读”为主，泛读的意义很小，不要妄想通过泛读论文来想出想法（idea）。科研新手泛读论文通常都读不懂，有时候自己觉得自己读懂了其实大概率是误解了。科研新手泛读论文还有个很大的弊端，觉得好想法（idea）都被别人做完了，总觉得别人的工作很高大上、遥不可及（其实很多工作只是表面光鲜），从而失去信心、热情。

只有精读才能较准确地理解论文内容，才能比较真实地看待一个工作，才可能看到这个工作的缺点（绝大部分工作都有明显缺点），才可能把这个工作的想法和技术借鉴到未来的工作中（即融入到自己的知识体系中）。

搞清楚一篇论文、搞透一个技术，然后以此为支点继续去搞懂其他的论文和技术，慢慢地知识体系就建立起来了，也会越来越有信心、兴趣去做科研了。科研新手自己是最重要的因素，但好的指导老师当然也很关键。

其他素材与杂想

论文数量繁多，精读跟自己的想法（idea）相关的论文就可以了。非常有趣的、简单的、经典的论文（比如最大熵、CRF、Transformer）都值得精读，有点像读书、学数学的过程，本质上是打基础。

带着问题读论文，别想着完全读透（有的实验结论会夸大其词，只有精读的才需要特别细致地看）。调研一个研究方向时（比如PM2.5），第一阶段应该是看大家都在做什么任务、任务定义是什么、模型输入输出以及评价标准等；模型的具体工作原理应该是第二阶段才看的。因为通过任务定义可能就会把一些论文排除在外了。

带着问题去读论文效率最高，和问题无关的内容可以不细看。一篇好文章可能需要看很多遍才能完全理解，看的时候关注点不同收获也不同。不要想着把一篇文章完全读透然后再产生自己的想法（idea），靠这种方式想出想法（idea）的成功概率太低了。完全吃透一篇论文需要很久很久的时间，或者说需要精读的论文并不多。把能读懂、需要读懂的地方读懂就可以了，其他的知道自己还没读懂也很重要，不能糊里糊涂地读论文。要明白自己想搞清楚论文中的哪部分内容，是方法、实验结论还是实验分析。

品味老论文也是一种乐趣，senior学者、有经验的研究者不时读一些老论文，看老论文中的一些观点、讨论以及点评等内容时会产生共鸣，会感觉以前的研究者其实都想到了很好的点子（idea）和角度，也会感叹技术进展的快速和缓慢。