李宏毅机器学习作业(Fall 2022)
HW1
描述
一个回归问题,由若干不同症状的患者,根据他们的症状给出 covid-19 阳性的概率
strong baseline 1.05728
boss baseline: 0.86161
Feature Selection
根据助教提示,第一步应该做好特征筛选。有些无用特征可以去掉,也可以根据问题特点想想 encoding 方式。稍微看了一下问题,感觉症状表征应该够了,关患者所在地区什么事呢?因此简单把前面 one-hot vector 的地区给去掉了。离谱的事情发生了,这一发直接干进了 strong baseline。。
仔细想想感觉不对劲啊,助教讲了半天的 one-hot vector 怎么会没用呢?看了一下别人的解析,地区确实是有用的特征。那我这咋效果这么好呢?第一个作业,我已经被深度学习的玄学震惊到了。
改造网络结构
把激活函数改为了 LeakyRelu,把神经网络的深度增加了一层。没有明显的提升效果。