一些碎片化的感想,大部分内容来自台大资管系主任庄裕泽教授写给学生们的信件。(偏理工科方向


做一个survey,要有一个主线框架,比如按照方法、数据、应用场景巴拉巴拉之类的分个类。可以有大量想法层面的东西,但是最后应该落脚到实际的论文或方法,这个落脚不需要具体到模型细节,但是至少能概括整个流程。


论文大致上有五、六章。第一章是 Introduction,这一章通常只佔论文整体篇幅的十分之一,却是最关键的一章;它就像一个物品的包装一样,即使结果再好,但包装差,也会让整篇论文顿时失色。在国际会议论文的审稿过程中,很多委员往往仅从 Introduction 中评断论文是否值得接受。Introduction 要如何写好是需要一些天份与努力的,基本上它就像在写作文一样,要有强而有力的开头,在前一、二段就能带领读者进入你要研究的领域。接下来的几个段落,你必须替读者建立足够的 background,让他们了解你论文的研究背景。Background 建立好之后,你必须点出整个研究的动机,这是最关键的地方,动机不足,无法显示你研究的重要性,变成无病呻吟,甚至连呻吟的声音都听不到,不晓得你到底要做什么。动机点出来之后,通常就会说明你的研究成果及主要贡献,也就是论文的价值之所在。在 Proposal 阶段,这部分会以预期的方式来呈现。最后,你会花一段文字来说明整个论文的架构,并做为第一章的总结。

这一段写得太好了,我就直接抄下来了。作为一个萌新,曾经一度以为论文的前两章(Introduction and Related work)是用来凑字数的,我觉得重点在于论文所提出的新理论、新方法、新效果,也就是一般论文的第三章和第四章部分。但是经过师兄和老板的多次强调以及考虑自己读论文的习惯,从某种意义上来说,introduction可能是最重要的一部分。我们常说以“貌”取人,一个好的“面貌”决定了人家有没有意愿来了解你有趣的灵魂(逃,introduction部分便是一篇论文的“貌”,还好这个”貌“是可以通过后天努力来改善的。另外提醒一下,大部分审稿人都很忙,一个基本的阅读流程1:Title→Abstract →Introduction → Related Work →Conclusion(这个总共花费五分钟左右),然后就可以做出accept/reject判断了,后面的时间就是从论文其它部分去找支持自己判断的点了。


第二章是文献探讨。在写这章前一定要仔细思考你要探讨哪些相关文献,这些相关文献如何分门别类,然后在第二张开头以约一页的篇幅描述你要 survey 的内容、范围与架构。当然,你得提供充分的理由说明为何你要做这样的组织分类。

一般而言,每个研究领域都可以拉的很广,你在有限的空间内不可能全部涉猎,因此,你得设定一适当的焦距,决定文献探讨的领域范围。

你得将这些文献分门别类,每一类别选定一个最具代表性的文献做这个类别的开端。接下来你得摘要这篇文献的主要内容与贡献,并且用比较简单浅显的方式让读者了解关键的技术。

这篇代表性的文献后续多少有些 follow-up 继续改进前人的结果,只要用一、二句话摘要出每个 follow-up 改进之处即可

把比较重要的 follow-up 说明之后,你应该以一段话做为这个类别的结论。这一段话必须评论目前在这类别的研究成果大致如何,还有那些不足的地方,以及与你的研究有何关联 (如你会采用那些既有的技术,你的研究方法或成果与它们有何差异,你的研究对这个领域的贡献是什么)。

这一部分讲述了如何做文献探讨,对如何写论文的related work也有一部分借鉴意义。尤其是最后一段,做完后要有自己的总结,给出自己的观点。不然就显得很表面,没有深度。


Survey 是做好论文的第一步,也是关键的一步。

目的:就是要对研究的议题有个深入且广泛的了解,这样才知道目前在这领域里研究的进展已经到什么地步,state of the art 是什么,有那些的子题及技术已经被探讨,从而也可以知道那些还可以开发,那些技术可以被你的研究议题拿来应用。

怎样才能把 survey 做的深入且广泛呢?

我的方法是你要知道在这领域里主要的国际会议是什么,然后把这些会议近几年来 (至少三年) 所发表过的论文的 title 及 abstract 浏览一次,找出跟研究议题比较相关的论文(注意:是「议题」,不是「领域」)。接着,你得把这些论文的 Introduction 看一遍,对它们做个初步的浏览。接下来就是依序把这些论文仔细的研读,每篇论文的重点是什么,关键的技术又是什么,都得弄得很清楚。

当你从最近的一篇论文开始往前追朔,大概不超过三、四代,你就会发现不必再追朔,因为再往前追朔,你会发现它们要么与你的研究议题愈来愈远,要么就是你研究领域的基本知识。

当你发现拿到一篇新论文时只要看完它的 Introduction 之后,你就知道这篇论文的重点及猜出它用的主要技术之后,你的功力已经提升到可以进入研究议题的阶段了。在这个阶段,如果论文的研读够深入及广泛,你往往也可以发现新的研究议题。

整个 survey 的阶段会看完几篇论文? 这当然看你的研究议题而定。但三十篇以上是跑不掉的。如果加上你只浏 Introduction 的部分,那可能在五、六十篇以上。

这一部分是介绍如何做文献survey的。基本思路就是从最知名会议中找出最近与自己研究方向最相关的论文研读,这里因为是初次涉猎,在看论文时会有很多疑问,论文中也有引用很多以前著名的论文,都先标记出来,等看完论文再去一起找出来。如此往前回溯,在这个过程中,对这个领域的进展和使用的方法和技术都有了一定了解。几轮下来,基本上论文中出现的引用都是自己看过或者有了解的了。万事开头难,等雪球滚起来后就相对轻松了,后面看论文会有很多重复的领域知识,可以直接略过了,甚至看完introduction你就知道这篇论文要干啥了。

参考