时间顺序。
国赛是从23年9月7日下午五点开始的。我们六点到实验楼开始看题目。第一题和第二题都涉及物理,不是强项,我们选择了c题。在星期四晚上,即9.7晚上,我们尝试将附件二(88万的销售数据)和附件一(蔬菜品类)综合在一起,但是我们发现win11的vs code不能够安装pandas包(虽然昨天晚上跟中国地质大学的学长提了一嘴发现其实我们可以用ananaconda来做,但是当时没有人想起来),所以我们打算手搓数据。在搓完一晚上数据后,已经十一点多了,打算第二天上午做问题一。
晚上回宿舍后,我发现国赛队伍可免费申请spsspro会员,但是会员在9.9才到。
但是在我们9.8上午(vigoro第一节去上课了,徐队第二节去上课)我们进展缓慢,因为代码跑不出来,spsspro网页版无法跑这么多的数据。我们发现手搓的数据有问题,四点左右打算重新搓一遍数据。我回宿舍洗澡的时候看了好几个excal的vlookup函数教学视频,七点回实验楼成功把数据综合在了一起。晚上的时候我们做了一些数据预处理,做出了第一问的第一小问的蔬菜品类间的分布规律。我们开始研究如何做相互关系。我们在思考是使用皮尔斯分析还是用spearman分析,然后三点回宿舍了。(晚上一点的时候,vigoro的舍友,我们计算机学院的学生会主席点了两只炸鸡叫我们到c栋楼下去吃。)
9.9上午我们为了在论文中更有说服力,给数据做了一个正态性校验。第一问第一小问正式做完。[em]e10297[/em] 跑蔬菜单品的分布规律和相互关系时,我们一开始打算把数据拆为春夏秋冬四个平均值来讨论它的分布规律,因为我们一共有251个单品,我们没有代码可以跑数据处理。在下午的时候,徐队用学校机房电脑捣鼓到了综合数据表,所以最后我们还是用了月平均值来探究分布规律。我开始写第一问的论文。晚上我们用spearman做出了单品间的热力图(电脑还卡爆了),但是放在正文的是单品销售量排名前十的,并不好看,有许多的蔬菜单品属于突然没有销量或者后面才进货的,但是当时已经跑不动了,我们三点才搞出这些数据.....vigoro熬不住了三点多回去睡觉,八点到实验楼,我是写完第一问论文凌晨五点回去睡觉,闹钟没响,睡到了十点。徐队在做第二问的第一小问的相互关系函数,没有回宿舍。(第二问的第一小问也很波折,但是我记不清了,这几天像个梦一样,如果想起来就最后一条条朋友圈说说)
9.10早上十点在宿舍惊醒跑去实验楼,十号晚上八点前就要交论文。我早上十点到了以后把问题一第二问的相互关系改进了一下,在论文里放了一些相关性比较强单品间的热力图。他们在十一点半左右把第二题第一问的函数关系发给我,我开始写第二题第一问的论文,(然后我发现根本找不到函数,他们在下午15点把lasso回归做出的函数发给了我),我记得当时论文才写了五千字。9.9中午开始思考第二题第二问解法,原先打算使用背包模型,但是跑出来的拟合效果很低,最后使用lasso回归训练模型做出了7.1-7.7的数据预测。第二题结束[em]e10294[/em]。第三题第一问要求我们根据单品做预测优化,当时已经下午四点多了,vigoro有点崩,我也很崩但是我论文才写了六千字,在疯狂写论文。我在17点的时候拿到了他们用catboost(好像是这个?)和线性回归(最小二乘法)的第三题数据,但是我当时的论文进度为:第三题的所有部分都没写完,第四问建议信还有一半没写。[em]e10265[/em]接下来可能就是我个人写作时间写到了七点,然后给老师看论文摘要,开始挨骂然后改论文摘要....他们两个没看论文内容,我犯了好几个低级错误,而且是明显的低级错误啊啊啊啊但是已经交上去了。
19:49我们把论文交上去了,八点我和vigoro在饭堂吃饭,饭堂只有广东肠粉店开着了,我们两个沉默的面对面吃饭...后来九点半的时候我们发现广东赛区不能用zip提交,要用rar,但是我们用的是zip,但是十点就不能改了,所以疯狂找徐队要密码,最后在饭堂二楼某个角落发现他在谈恋爱。
结束了,这几天严重缺觉,就像是一场梦,论文写到最后根本不知道那些建模过程,纯靠意志力在写,也没有复查。这回论文写的真的很潦草,而且省奖不看附件,只看论文写的好不好.....我完蛋了