题图摄于杭州植物园,这是一个比太子湾更休闲的地方,因为人足够少,又不像良渚那样离玉泉那么远。
一节课也没有上但又忙到不行的学期就要结束了,我的大四也接近尾声了。想到去年这个时候,我在名义上的最后一个学期上到了最舒服的几门项目课。所有的大作业基本都是开发导向的,很多原理或许可以不求甚解。我觉得对于我个人的天性而言,开发和工程可能是更加合适我的位置,我最擅长的技能,大概还是规划和如同搭积木一般的模块组合吧。
其实对于我而言,2023年已经正式宣告了学生时代的结束。
在接下来的三年研究生的生涯里,大概是很难再有以一个完全的学生心态去听正经的课程的体验了。可能研究生一二年级都要赶忙准备论文的发表,最后一年要准备进入工作,忙着实习和面试了。某种程度上来说,今年我已经完完全全是以一个准研究生的节奏在未来硕士的实验室开始相关工作了。
从2023年的暑假开始,似乎就进入了以四个月为一个轮回的每年三大AI会议的投稿。截稿前两个月的实验赶工,把主实验的性能刷上去,截稿前两周的文章赶稿,凑齐需要的消融实验,截稿后立刻整理开源版本代码,一个月后等审稿意见出了在十天之内赶出三四个实验进行rebuttal。rebuttal之后简单休息两周就可以进行下一次项目的实验了。急速奔跑的科研氛围下的日常生活真是如飞轮般旋转,甩得整个人东一块西一块的。在接下来的三年研究生的生涯里,大概是很难再有以一个完全的学生心态去听正经的课程的体验了。可能研究生一二年级都要赶忙准备论文的发表,最后一年要准备进入工作,忙着实习和面试了。某种程度上来说,今年我已经完完全全是以一个准研究生的节奏在未来硕士的实验室开始相关工作了。
进入这种生活节奏可以说是半自愿的。自愿的一半是,就我个人而言,这段科研是我接触到的对个人来说最好的一次机会,而非自愿的一半是,在项目赶工之间来自deadline的压迫。有时候不免自觉学生是一种多么特殊的身份,承载着高期望的同时又似乎有很大的风险。这种自觉在获得实验室的小小收入之后,在回望过去的时候又不免更加强烈。说起来,选择继续在算法领域做科研时我更多是出于兴趣而不是前景,我当时只是单纯想要了解人工智能的本质是什么。然而领域火爆的当下,其实简单的规律不难理解,而黑盒之内的大象还没有人知道长什么样。
比起我身边已经找到工作和没有深度参与科研的保研同学,我感觉自己很难真正休息。就像经典的八小时工作制之外,需要等额的休闲和睡眠时间,我需要比较充足的时间来同时实践爱好和安静的自处。我是属于闲不住的那类人,一旦真正闲下来,就会有进行创造性活动的冲动。不过最近一年高强度滚动的生活还是让人有点经常性处于多巴胺不足的情况,经常观察到自己处于在焦虑中拖延的情况,手头有事+不想干事=无法毫无负担地真正休息,情绪状态相比之前感觉也不稳定了很多。可能需要出门好好骑一次车,好好喝杯奶,好好睡一觉。
说实话,我怀疑这并不是我个人的症状,好像我的学长们都处于更加作息不规律和更加爆肝的工作中。大概,我应该从这种连轴转的项目节奏中脱离出来,冷静地调研和琢磨一个更加长期和有创见的工作,而不是在短平快的节奏里面来回翻滚。
近来,在科研中时常感觉到,自己近十年以来不断迭代的思维方式受到了很大的挑战。在学习能力这一方面,我最擅长的,自高考达到巅峰而在大学继续散发余热的,要数复制性的学习能力。这种复制性并非死记硬背,而是举一反三式的复制,但终归是复制的一种。在考学阶段,试题不过是考生和考官在考纲范围内的对弈。但现在进入科研领域,面对的是全新的未知的课题和世界,这需要一种数学感,或者说那种在未知领域发现本质的能力,而我所熟悉的是组合和重构已知的要素。以往就对此有所感受,尤其再解决数学压轴大题和语文作文时,感受尤为强烈。但考卷上这两块的丢失总归是有限的,剩下的90%,良好的领域内的复制能够做到很高的正确率,因此最终还是采取了半放弃的对策。
在写作上,这种对未知的不适应会表现为,我只能记录身体和灵魂的切身感受,而很难进行虚构;在绘画上,会表现为,喜好临摹而很难原创,甚至我自觉,很多时候我画下来的,不过是看到一幅佳作之后脑海中的复刻;在摄影上,表现为对一个具体的对象进行构图,表达出一种明显指向的观点,而很少拍得出有意境、意味抽象的照片。可能我的大脑是典型的工程师脑而不是艺术家脑。
写到这里我又回忆起初中时做纸上游戏的一件事。当时是初二的暑假,纸上游戏吧的吧主霜音侯爵做了一款以暴雪星际2为背景的纸游。我很喜欢星际争霸2这个IP,于是按照类似的规则在自己曾经的三体纸游的基础上立刻着手复刻了。当我在吧务群里发出自己的”作品“的时候,意外地被侯爵看出了明显的”借鉴“痕迹。事实上,再被指责抄袭的前一刻,我都没有意识到自己实际上只是对核心玩法做了换皮。而那时我回头看自己以前发在贴吧里的纸游:两个来自我看到的书中介绍的纸笔游戏,两个是搬了当时很喜欢的两款新桌游的概念(而我当时甚至没有买过来玩),只有三体的那款(《星战》)和一款没有发布的纸游《火龙魔牌》是根据看过的小说内容制作的,而游戏逻辑实际上完全来自于小说内容。我意识到这并没有做到我所认可的那种玩法上,机制设计上的本质创新。后来,我实在感觉自己的脸面在圈里有点挂不住,很着急地想了好几天,做出了《偷花贼》,我真正意义上的,第一款有玩法创新的纸上游戏。不过,后来因为时间和兴趣的转移,我再也没有在纸上游戏吧投稿。
这大概也是为什么物理竞赛会更加适合我而数学竞赛并不适合。因为物理模型概念是具象和已知的,解题的整个过程也变成各种公式之间变量的整合的固定模式,本质上,这就是在一个场景下,用合适的物理模型挑选出合适的函数,然后用类似多个函数的嵌套的思想来解决。但是数学不一样,难题往往需要悟,但我”悟性不好“。
但实验室的学长们也跟我说,想法都是多看论文多讨论多聊才提出来的,他们的想法也并非凭空而来。确实,每天都在调试代码赶实验,要么就是忙着出门忙着打游戏放松自己,很少静下心去看看前沿究竟在研究些什么,这并非一个科研人本来应该采取的步调。或许确实应该找时间专门看一会儿论文了。
比起算法中的领悟,我觉得我可能对AI原生的产品领悟更多一点。我发现现在很多AI产品的发展方向是诡异的:一部分人还在用开发非AI原生APP的思维来做AI产品,AI只是APP中一个无关紧要的附加玩具功能;而另一部分人则忽视AI本身能力的扩张性,试图用一些传统的pipeline的思维去解决一些端到端的任务,其结果是APP的全部功能成为下一代的底层大模型的子集。事实上,AI原生APP,除开模型,最重要的部分是人机交互,也就是构建一种更好的交互方式,让AI对于用户而言更加可控,这才是向专业化、生产力化发展的正确方向。
这里就简单引一段OpenAI CEO Sam Altman在一次访谈中说的话吧!
现在有两种建立在AI基础上的开发策略。有一种策略是假设模型不会变得更好,然后在此基础上构建各种小型应用。另一种策略是假设模型会以相同的速度不断改进,就像露天矿场保持相同的轨迹速度一样。在我看来,世界上 95% 的人应该押注于后一种策略,但很多初创企业都是在前一种策略中建立的。
更多的想法可能等以后再写成文字吧。