个人简介
刘强,2013年考入中国科学院自动化研究所硕博连读,于智能感知与计算研究中心,大数据与多模态计算研究组开展研究工作,指导教师为王亮研究员,研究方向为数据挖掘和用户建模。在学期间共发布9篇一作论文,其中包括AAAI两篇,CIKM两篇,SIGIR两篇,ICDM一篇,IEEETKDE一篇,ACM TIST一篇。曾获得微软学者奖(亚洲仅10人)、博士生国家奖学金、攀登一等奖学金、Rokid奖学金、中科院三好学生等奖项。
2017年12月19日,在自动化所研究生会组织的第六期国家奖学金获得者经验分享讲座上,我们大数据与多模态计算研究组的大牛师兄刘强给大家送上了满满的干货。下面让我们一起重温一下师兄所讲~
科研论文写作
关于科研来讲,大家最关心的可能是论文,就是如何写一篇好的论文。但什么是一个好的论文?好的论文可能包括三个方面,第一是文章本身,第二是实验,第三是科研内容。
首先是写作的过程。从写作角度,怎样才是一个好的论文呢?我们认为有五层境界,第一层是hard to understand,第二层是everything is expressed,第三层是easy to read, 第四层是attractive,第五层是通往新世界的大门。大家要尽量做到第三层和第四层,如果分布在第一第二层,先不谈你的实验做的怎么样,你的idea怎么样, 文章的表达就已经严重影响文章的录用。所以写作是做好科研的第一要务。
Tip 1 : 讲好一个故事
那么一篇科研论文的核心是什么?我的答案是讲好一个故事。不只写文章是要讲好故事,毕业的时候写简历也是讲好这个人三年或者五年的故事。可能你的算法很简单,但把这个故事讲好,你或许也能中一篇文章。讲故事主要是从motivation来讲,即你为什么要做这个东西。模型可能很简单,但是从解决问题思路来讲,很好地解决了一个问题,这也是一篇容易被接收的文章。讲故事能力可以说是非常重要的让论文被接收的要点。
Tip 2 : 给写作留下足够的时间
完成一篇科研论文要给写作留下足够的时间。现在很多同学喜欢赶论文,比如说十一月十五号截稿,为提高我的performance一直做实验,到了十一月七号还没有动笔,这样我觉得就可以放弃了。我的第一篇论文是这样的,我是一三年入学,然后一四年一月份假期的时候开始和老师讨论,看了一些东西,讨论出了一个方向。当时讨论出一个解决方案就回家过年了,过年回来之后二月底三月初开始做实验,做了两三个月大概到六月份的时候实验基本做完了。从四五月份我就开始边做实验边写论文,一直到九月中旬投稿,写论文大概写了六个月。所以如果你能留下足够多的时间写论文,你的接收率会提高很多。我建议大家如果写第一篇文章的话,至少留下三个月的时间去写作,这很重要。到后面的话一个月可能也可以,但是我觉得除非是很厉害很会讲故事那种人,要是只留一两个星期去写论文的话,基本没人看得懂。
Tip 3 : 让别人去读你的论文
除此之外,还要让别人去读你的论文,尤其是那些不懂你的研究方向的人。如果这些人能很好理解你的论文的话,论文就有很大的概率被接收。我们要把reviewer当成什么都不懂去对待,不要想当然地以为他什么都懂,以为写到这个程度reviewer就会明白。然后我说了这么多写作的事情,讲故事的事情,对大家发论文毕业很重要,但我想说不要做paper machine,要做有意义的工作。
Tip 4 : 做好预估和规划
下面我说一下怎么得到好的实验结果。首先在你做实验之前要审视你的方法,要预估出方法到底有没有提高。很多人喜欢去试,比如说可能有三种方法,然后每种方法都试一下,最后可能一年半过去了。我的建议是在真正动手去做之前,把整个算法写下来,去预估每一步会带来什么样的提高,去分析这些为什么会提高。一是省时间避免无用功,二是对文章的motivation也有好处。很多人想到一个东西然后就开始试,两三个月过去了,然后完全没有用。其实很多工作动手之前可以预估以后会不会有提升。另外,实验之前要做好计划,计划好这个实验需要做哪些,提前把框架搭好。因为有时候需要做一些调节参数的实验,或者是重复性的实验。这样的话,提前把实验规划好会是事半功倍。
Tip 5 : 合理地设定实验
设定实验时一定要证明你算法理论各个点,前文提出了一个点在试验中一定要证明这个点有用。比如,算法提出三个点,最后只给出了一个overall performance的提升,对读者来说不会知道到底是哪个点带来提升。论文里面每一个点,提出每一个问题都要在实验中得到验证。另外,设计模型做实验的时候,要从发现问题解决问题的思路去做。这样有两个好处,一个是好讲故事,发现问题是要解决这个问题,另外就是如果真正有这个问题你真正去解决了,那自然会带来提升。
Tip 6 : 解决当下或者未来的问题
下面讲一下什么是一个好工作,这个是文章工作的核心。我觉得一个好工作第一点就是要有启发性,这篇文章可能很多方面不是很好,或者说不能直接应用,但是文章有很强启发性,能带来更多更有价值的工作。另外最重要一点,就是解决问题。解决什么问题呢,可能有两方面,一个是实际问题,一个是科学问题。实际问题就是,现在当前工业界不管什么地方遇到了问题,把它解决了发现了改进了。现在很多行业需要AI或其他技术去解决,与行业去结合然后去解决问题,我觉得是一个从业者需要关注的问题。科学问题就是说这个问题可能当下没有直接应用,但是未来可能会有用。比如说八十年代Hinton做神经网络,当时是没有用的,但是多年后解决了很多重要的问题。解决当下或者未来的问题的工作才真正好工作,而处于二者中间的话一般来说是没有什么意义的。因为二者中间就是我们现在和未来都解决不了任何问题,就是科学界或者学术界自己玩的游戏。综上所述,一个好工作第一点要有启发性,第二要解决当下或者未来问题。所以建议大家这样去看自己做的东西,尽量要解决当下或未来的问题。
开放的心态
然后我们一定要有开放的心态。第一点是要广泛阅读,不只是阅读跟研究点有关的论文,还要阅读跟研究点无关的一些领域内的知识。比如研究人工智能方向的,可以看一些不是人工智能的资料,很多人喜欢看神经学或者心理学,有很多东西可以去借鉴。第二点是多交朋友,去开拓你的眼界,你可能正在思索一个问题在别人那里是很简单一个问题。这些朋友可以是同一方向的,也可以是不同领域的。第三点是多参加会议,参加会议的时候一定要去多认识一个人,不管是学校的老师学生还是工业界的人,这样会开拓你的眼界,给你丰富的信息去借鉴。据我观察,可能百分之五十以上的工作都会在其他领域的文献中找到相同的东西。
关于实习的事情,我的建议就是如果有机会尽量去实习。这几年我实习过,但我觉得还是相对比较少的。一是实习是一个可以开阔眼界的过程,知道真正需要做的是什么;二是可以认识更多的人,为未来道路铺好很多捷径;三是工业界有很多数据是你在学校里想不到的。尤其对于一些新入学的学生,有机会去实习是一个快捷的上手途径。我认识很多学校里科研成果非常突出的朋友,其中相当一部分人有着非常丰富的实习经历,甚至有些人一半以上的时间都是在实习中度过,或者大部分代表性工作都是在实习过程中取得的。
(本期内容是在自动化所研究生会根据刘强的报告录音整理的文字材料基础上经小编编辑而成)
地址:北京市海淀区中关村东路95号智能化大厦
电话:010-82544513
传真:010-82544485
邮箱:contact@cripac.ia.ac.cn