1. 前言

2020 年注定是不平凡的一年,2020 年于我来说是也是特殊的一年。有句话是这么说的,个人的发展固然重要,但也要考虑到历史的进程。在新冠病毒疫情肆虐全球和全国上下常态化疫情防控的大背景下,它也给我带给我一些难得的机遇,给我带来一些得以将所学知识/技术投入实践当中的机会。

写年度的个人总结,是在十二月初萌生的想法,这个想法源自于我近半年来每天在 Notion 上对自己工作进行复盘的习惯。“吾日三省吾身”,坚持复盘对我的学习、工作和人际交往都起到了良好的促进作用,但是我以往的复盘都局限于一个小的时间段,复盘效果有限,于是就想着是不是做一个时间跨度更长的年度总结。

今天刚好考完初等数论,往后便只剩下一门考试,学业上的压力没那么大,刚好趁这个机会把个人的年度总结给做了,对自己过去一年的各个方面进行总结,回顾这一年的得失,也算是对自己负责。

2. 近一年所做事情的回顾

2.1 学习上

2.1.1 难顶的专业课

先说专业课上的,今年上半年受疫情影响,我们整个学期都没有返校,所有课程都改为线上授课,大部分课程的期末考试也改为提交课程大论文或是线上考试,只有少部分留到返校后线下考试。由于我在此之前参加了数次科技竞赛,深谙怎么写好(水)一篇论文,以及一些众所周知的因素,导致我本学期的学分绩相比之前的几个学期都有了巨大的进步,将难看的学分绩往上抬上去了一点,至少不用担心是不是拿不了学位证的情况了。

下半年到了大三,首先感受到一个特别明显的变化就是师范专业课变得多起来了,专业内卷更加严重了。前者让我一度很抑郁,因为我每天绝大部分的时间都被这些课程和完成这些课程的作业所占据,根本没有时间去学习自己想学习的技术。后者当我认清了其中的本质之后,自己倒也释怀了,不同他们一起卷了,不陷入内卷陷阱当中,而是去做自己对未来的自己真正有用的东西。举个例子,假设一个课程论文我花 50%的时间能够做到 80%的水平,换做以前的我,我会花剩下 50%的时间提升到 95%的水平以上,而现在的我只会选择花一半的时间去完成一个 80%水平的东西。

2.1.2 和自然语言处理纠缠不清的一年

2020 年我自己的技术学习,绕不开的肯定就是 NLP(自然语言处理)。

2019 年 9 月,临近中华人民共和国成立 70 周年,学校的官网有一个需求是需要写一个监测脚本,无需同系统耦合,便能够检测网页是否被篡改,在工作室健雄师兄的指导下,第一次真正意义上接触了 NLP 这一领域的知识,熬了一个通宵后,通过查阅相关论文,写了一个基于 TF-IDF 的防网页篡改监测脚本,后来也藉此成功申请了学术基金。自此,我算是一只脚踏进了 NLP 的大门,从那之后我便经常从知乎、公众号等平台,了解 NLP 领域的相关基础知识,直到寒假时间相对充裕,系统性、结构性地学习了机器学习、NLP 的相关课程,建构了这个领域相对完善的知识框架,也开启了我的调包侠之旅。

今年参加的前两个竞赛:美赛和泰迪杯,选择的题目都涉及到了 NLP 常见任务:文本分类(Text Classification)和情感分析(Sentiment Analysis),在泰迪杯中取得了不错的成果,最后拿到了省级一等奖,国家二等奖。但是在这些竞赛中,使用的基本都是机器学习算法,撑死用个 BERT embedding 结合一些机器学习算法,其实都是一些深度学习领域中 baseline 的方法,亟待提升的空间还是很大的。

在基本掌握机器学习领域常见算法(会调包)和做过一定的 NLP 任务之后,在暑期我又学习了改变 NLP 生态的预训练语言模型 BERT,不得不说学习 BERT 是十分令人痛苦的一件事情,由于我之前对于神经网络的理解并不是特别深刻,就连卷积、池化这些最基本的概念可能都需要好久才能理解。不过好在由于强大的兴趣驱使,还是把 BERT 啃下来了,只是现在只记得大致框架,具体的细节实现已经忘得差不多了。

BERT

之后便差不多到了返校的时间,返校之后专业课与工作占据了我绝大部分的时间,对 NLP 的学习也只得搁置,只是从关注的一些公众号了解一些碎片化的知识,在自己忙碌的工作当中,作为聊以慰藉自己的一个手段。其实直到这个阶段,自己心里还算怀揣着考自然语言处理方向研究生的梦想的,直到 11 月的某一次契机,审慎地对自己进行全方面评估之后,觉得自己大抵还是不适合考研,做出了拥抱开发岗,不再在 NLP 领域花费所有的精力,而是只作为自己的一个兴趣与爱好的艰难决定。

2020 年与 NLP 的故事大致就是这样的,个中有许多捶胸顿足的懊恼,也有许多喜出望外,无论如何,这都是一份宝贵的经历。另外,今年虽然绝大部分时间都花在了学习机器学习与自然语言处理上面,但还是零零散散点了一些技能点,如 Docker、Kubernetes、Vue3.0 和 Devops 等一些知识。

2.2 工作上

2020 年,主要的工作可以分为大的几块,分别是学院、党支部、班级。

2.2.1 在团学青

今年上半年我在学院担任易班技术部部长,2020 年之前,也就是担任易班技术部部长的前半年,自我感觉部门的工作压力其实不大,每个月的工作基本上只有固定的数据统计工作,除此之外整个学期便只有一次举办轻应用开发大赛的活动,当时的我一度怀疑我所在的部门会不会明年就被裁撤掉了,就像《Yes, Minister》里面的 DAA 一样。但是一切很快发生了改变,一场突如其来的疫情几乎打乱了所有人的规划,前文提到大环境的背景带给我了一定的机遇,这也是我下面想说的。

大概是三月中旬,学校第一次颁布了返校通知,初步决定四月中旬返校,所以往前推半个月就需要收集每个同学的体温信息。此时两个问题亟待解决摆在了学院面前,一是通过什么平台来收集同学们每日填报的健康信息,二是通过怎样的方法可以快速知道哪个同学今天漏报。当时的我接到了这两个任务,便开始着手设想如何解决这个问题,最终综合各方面考虑,我决定采用第三方表单平台+Python 脚本辅助的形式来完成这两项工作。自此开始,学院每日的体温填报的收集与整理工作便落到了我的肩上,每天下午 2 点我都需要收集好当天的填报情况,上报至辅导员处。在对脚本进行了几次优化之后,每天的工作便简化为从第三方平台导出数据,再跑一遍脚本就可以完成当日的工作,工作量虽然不大,但是处理上需要比较耐心细致,但是想到自己所在的职位终于不算闲差了,想到自己能够为学院学校的疫情防控工作贡献出自己力所能及的一点贡献,累一点也就无所谓了。上半年的工作大抵是这些,工作基本都是配合学院的疫情防控工作,收集学生的各类报表,统计未填报人数,如此反复。

易班工作站

到了下半年,想到自己的一些抱负还没有实现,便留在了主席团,担任学院的易班工作站站长。我下半年在学院的工作基本都是一些大体上的一些安排,除了年底撰写易班年度总结报告,需要亲自完成的具体事务已经比较少了。再之,下半年完成的活动并不像上半年那样重点足够突出,多的都是一些相对琐碎的事务,在这里就不赘述了。

在学院团学青待的接近两年半时间里,感觉个人成长了不少,就任主席团的半年来,在经历了各种各样的事情之后,自己在心态上也成长了一些,老实说我以前是一个挺固执己见的人,希望每件事情都遂自己心意,觉得每件事情只有自己亲历亲为才能做到最好,但是我们终究是人,是人就会犯错,这半年来最大的感受就是自己的包容心也变得更强了一些,懂得克制自己,感情中也多了一些中间地带,不再是非黑即白。

老师和主席团的小伙伴

2.2.2 在党支部

在今年,我很光荣地成为一名预备党员,在进入党支部之后,大部分时间都主要负责党务系统的工作。当我写到这里的时候,我查询了我 Notion 里的相关的任务记录,发现除去上面提及的党务系统工作,按照时间先后,还参与了答辩、院党培、新生思想引领、通表、转正和推优等一系列工作。

党务工作一开始着实让我抓狂,有些材料昨天还是对的,到了今天可能就不对了,需要重新做材料、补材料。没办法,只能从头开始学,了解每份材料里面每个日期之间的逻辑关系,万事开头难,但是到后面经手的文件多了之后,处理起这些材料来也就顺手多了,到了能够一眼瞪出来出错的部分。还有一个让我比较骄傲的事情应该就是写了一个党务系统批量导入的脚本,当时接到一个十分紧急的任务,要求 2 天内导入 200 多个填写入党申请书的新生资料到系统之内,但是党务系统是一个十分反人类的系统,除了 UI 设计十分反人类,它甚至还不支持批量导入功能。我还记得那天是考完四级的下午,我花了一个下午的时间抓包,分析接口的每个字段的含义,最好写了一个 Python 爬虫,将 200 多个同学的信息批量导入进了党务系统,这事情挺让我自豪的。我发现在我的工作中只要涉及到重复性的操作基本都要被我用脚本解决,这已经成为了我一种工作的新常态。

党支部小分队

2.2.3 在班级

今年上半年也就是大二下半学期,我在班级担任班长,除了疫情期间组织了几次班级会议,基本上也没有干一些特殊的工作,这里就不详细展开了。值得聊聊的应该是下半年担任新生助班的工作,在我大一的时候,我就曾经暗暗发誓自己也要成为像我的助班师姐一样优秀的人,在经过大一大二的沉淀之后,我成功竞选上了 20 级的新生助班,成为了 20 数师 1 班的助理班主任。说句题外话,其实我是想竞选大数据专业的助班的,但是由于种种原因,最终老师还是让我担任我所在专业的助班,尽管不是当了自己理想专业的助班,但我还是尽心尽力做到最好的。

新生还未开始入学,那会就已经忙碌起来了,每天醒来都是各种信息轰炸,需要统计新生的各种信息报表上交,需要催尚未填报体温的同学及时填报体温,新生未到校之前有些工作反而是更加难开展的,因为你找不到他的人。相反等到新生报到之后,选定了班级临时负责人,相关的工作虽然还谈不上有条不紊,但也能开展得顺利多了。随后的军训期间大多也是一些琐碎的事情,整理材料和报表提交到学院或者学校,在疫情防控的特殊背景下,如果有同学出现发热或者其他疑似症状,那也是挺让人头疼的一件事,在军训期间我有一个晚上就坐上了四次救护车,带班里的同学完整地走了两遍发热门诊的流程,确认没事之后才回到学校。军训结束之后便是班委选举、随后还有新生档案整理、准备期中考试等一些事情了,在此就不细表了。其实在我看来担任新生助班其实是一件挺累人的事情,有些同学觉得担任助班是会有补贴,其实是没有的,是完全的为爱发电。但是如果一件事情真的除了累之外没有别的,就应该就不会有这么多人对担任助班这件事情趋之若鹜了吧。

其实我感觉我是十分幸运的,因为我遇到了一个特别 nice 的班级,一个特别 nice 的班主任,一位十分好相处的助班助理,他们让我不用让我太担心班级管理和班风问题。我其实特别担心班级里会出现那种刺头,我自认我是不会做思想工作的人,所以如果要让我来给这种人做思想工作的话我是根本顶不住的,万幸的是我们班所有同学都十分优秀,没有出现这种同学。班级的学习风气在班主任李老师的带领下在整个学院是首屈一指的,各班委对待班级的各项事宜都能够尽心尽力,真真正正地让我感受到青出于蓝而胜于蓝,感受到后浪的威力,相信这样的班级拿下明年的优良班风标兵不是大问题。于我个人来说,我第一次认识这么多来自五湖四海的同学,能够与他们成为朋友,也算是人生一大幸事。

20数师1班

2.3 竞赛上

2020 年一共参加了四个科技竞赛,分别是美赛、泰迪杯、数模国赛以及大湾区金融建模竞赛,这其中有惊喜也有遗憾。

2.3.1 美赛

今年的美赛因为疫情延期,比赛时间比起往年延期了一个月,我和我其他两位队友第一次通过线上磨合。美赛当时选择的题目是基于电商网站评论数据进行相关营销策略的制定,选题有点像 NLP 又有点不像,总体上是基于评论数据进行数据挖掘,有点类似于 Kaggle 类的数据竞赛,但是由于时间比较紧张,加上队友们都是第一次磨合,也只是建了一个简单的情感分析模型,匆匆结束,最终收获 S 奖,只能说希望今年的美赛能够有一定的进步吧。

2.3.2 泰迪杯

泰迪杯是在 5 月左右举办的,在此之前我系统学习了机器学习的相关课程,也时候机器学习完成了一些 NLP 任务,所以泰迪杯的时候毫不犹豫选择了 C 题,一个文本分类的题型。如果是现在的我来做我肯定 CNN、RNN 卷起来,各种深度学习模型,但是当时的我还是觉得深度学习多多少少有点黑箱的成分在里面,对待他的认识不够深,所以我最后选择的是用机器学习的方法解决文本分类任务。最终的分类准确率也达到了 90%左右,还算是比较 ok。题目后续部分涉及文本挖掘,查阅了相关论文建立了一个关联挖掘模型,算不上比较出彩,但是由于泰迪杯的比赛时长足够充裕,最后的论文打磨地足够充分,最终拿了国家二等奖、省级一等奖,还算是比较满意的成绩,比起去年初次参加的国家三等奖、省级二等奖有了一定的进步。同时,这篇论文也是我大学以来最满意的一篇竞赛论文。

2.3.3 国赛

数模国赛在返校后举办,对我来说就像梦魇一般,当时使用逻辑回归作为预测指标做出的一种结果(后续看国赛优秀论文证明这种方法是完全可行的),因为种种原因被推翻了,导致一天半的努力完全白费了,最后用的模型是最为简单的线性规划,实现的效果不算好,最后改论文太急还不小心把最重要的部分从摘要里给错删掉了,提交论文的时候就知道这次竞赛成绩不理想了。最后也只是堪堪一个省级优胜奖,一次完败。这次比赛之后还一度陷入很低沉的情绪,甚至想过是否就此收手不参加比赛了。

2.3.4 金融建模

今年 10 月的时候,泰迪杯的主办方搞了个新比赛,叫大湾区金融建模竞赛,首届举办的比赛并没有收取任何报名费,所以我索性就报了,想着题目要是太难就弃赛算了。比赛时长是一周,当时的我刚考完教师资格证,2 倍速刷了一个量化交易实战视频,学习了量化交易里面一些基础的思想,这其中就包括了我后续论文中用到的集成学习模型,我感觉应该是这个朴素的想法使得我们队伍的最终评级向上抬了一个等级。这个比赛需要使用特定的软件和接口获取股票数据,所以存在着一定的学习成本,我也是直到第二第三天才理清他软件和 api 的逻辑,写出了第一题,但是写出第一题之后就顺风顺水了许多,后续基本都是在第一题的基础上对局部的选股指标进行优化。在最后提交论文的时候,我个人感觉水平大致最多在二等奖左右,一方面因为我们是第一次接触量化交易,许多想法不够成熟,另一方面在进行实盘操作的时候,回测效果并不是和好,甚至一度负收益。但是在最近出成绩的时候,着实吓了我一跳,居然拿了一等奖,我也不知道该说什么了,也许比赛有时候更需要一些灵机一动的“巧劲”吧。

3. 小结

回首 2020 年,在年初定的几个目标有少许几个是完成的了,但是绝大部分都是中道崩殂。正如上面说的,2020 年的我学了一些新的技术、结识了一些优秀的人、积累多了几个项目经验,但我总还是觉得不够,总觉得自己还是没有全力以赴地去生活,但是有时候自己转念一想又会怀疑,是不是一定要让自己每天的生活都熠熠生辉,才算得上完满呢?难道不是有遗憾,得得失失才是生活本来的样子吗?不得不说人是一个很矛盾的东西,也许成长的过程就是一个不断和自己调解的过程吧。

2020 年,养成了两个新的习惯,一个是更关注时政了,今年在哔哩哔哩看得最多的几个 up 应该是观察者网、沈逸老师和马前卒等几个时政类和知识类的 up,另一个习惯是从下半年开始养成了在 Notion 上记录一切可以记录的东西,包括但不限于完成的任务、账单、学习笔记和摘录等等,这个习惯使我对自己所作的事情有了一个清晰的规划,原因写这篇接近六千字的个人年度总结也是受这个习惯的影响。因为我甚至复盘对一个人进步的重要程度。

青春由磨砺而出彩,人生因奋斗而升华。我在我 22 岁生日的朋友圈里这样写道:“我不期望二十二岁这一年,有什么一往无前的孤勇,或者沉到海底的决心,只希望自己能够对自己更诚实一点,对生活更加城市一点。”现在的我也是这么想的,我希望自己在 2021 年里能够继续做自己喜欢的事情,完成自己的既定目标,多尝试自己未曾踏足的领域,逃离自己的舒适区,认认真真地刷算法题,踏踏实实地学习,勤勤恳恳地工作,好好地谈一场恋爱,如果都能做到,那我也就满足了。

愿大家都能变得更强。

Hsinyan

2021 年 1 月 1 日于佛山

最后修改:2022 年 01 月 25 日
如果觉得我的文章对你有用,请随意赞赏