寒假实践:我的挑战杯寒假纪实

  学校里要求要交一份寒假时间报告,刚刚交上纸质版,现在发出来吧,没有什么可写的,只有收获最大的挑战杯了,作为齐工大的学生,省赛本土作战,也希望能顺利通过校赛进入省赛吧,毕竟本土作战也是参加比赛的唯一一次了。

  挑战杯,在大三这个时候,已经变成了我最后重要的一个比赛了,想了想自己的规划,可能马上就要离开大学的校园,踏上社会。因此,自己极力想要把握住最后的一个寒假,去做好这个项目,也希望能通过这个项目最终得到老师和同学们对我们团队成员专业能力和素养的肯定。

  当刚刚放寒假时,挑战杯校赛的初赛结果下来,本来我并没有抱着很高的期望,虽然这个项目拿到过软件设计大赛的省一等奖,但是作为这个项目的重要开发者,我深知这个项目的不足。不过,初赛的结果还是意想不到,两位评审老师都对项目打出了4分的分数,并且给予了肯定,提出了改进意见,足以看出老师们对于项目的期待。作为负责人,我当然要尽力去争取这个项目能够在挑战杯的道路上更进一步。把握住大赛这最后一次大型比赛的机会。为此,在寒假期间,我又特地向我的导师成金勇老师询问了项目的细节,老师也给我提供了许多可行的算法开发的方案。当然,其中不乏一些硕士研究生阶段才会接触的深入算法,同样也看出来成老师对我们团队项目报以的期望。

  我们开发的项目为基于互联网大数据的就业分析系统,其中最重要的功能就是帮助在校的大学生和已经步入职场想调换工作的人进行成绩、专业能力和可能的薪水之间的配对工作。我们想最终通过对大数据的挖掘分析,一方面,让在校学生了解企业对人才的需求动向并对以后的就职提供帮助,另一方面,根据社会需求的趋向给予在校生未来的就业参考,并能为高校在专业设置与招生人数上的一定参考数据。

  为了进一步完善项目,寒假期间我也专门做了项目的调研分析工作:随着目前市场经济的发展目前大数据正在逐渐成为市场热点,关注度不断提升,虽然真正投入市场进行就业预测方面的大数据实时预测分析的产品较少,但因其准确性和实时性,该技术将会逐渐代替人工预测分析。

  最终也形成完整的项目分析被我写入我们的项目申报书中。

  除了进行市场方面的调研,最重要的就是进行算法的改进,一开始我们的项目采用的时kNN和SVM算法,相对来说这两个算法属于分类预测算法之中比较简单的算法,在和成老师交流之后,我最终根据自己的机器学习体系的学习情况和项目的实际,选择采用了随机森林算法,这是集成学习bagging的一种代表模型,随机森林模型正如他表面意思,是由若干颗树随机组成一片森林,这里的树就是决策树。作为新兴起的、高度灵活的一种机器学习算法,随机森林(Random Forest,简称RF)拥有广泛的应用前景,从市场营销到医疗保健保险,既可以用来做市场营销模拟的建模,统计客户来源,保留和流失,也可用来预测疾病的风险和病患者的易感性。而我们的项目也是对成绩进行建模,来预测未来薪水的可能大小,虽然说薪水应该采用连续性变量,但是在实际中,总是会产生薪水的上下浮动等未知因素,因此,离散型的模型反而能更准确地定位到未来可能的薪水,而Random Forest在准确率方面还是相当有优势的,尤其相比之前采用的kNN和SVM算法,随机森林很好的避免了过拟合的情况发生,并且经过参数调优之后,在进行验证准确性时,发现,在5000条数据中,准确新接近95%,很好的提升了系统的分析和预测的能力。

  不仅如此,寒假期间,同样和几位在职多年的IT行业的大佬,进行了深入的交流,随着经济寒潮的到来,互联网产业也迎来了寒冬,整个行业都产生了不景气的情况,薪水相比以前也有了大幅的下降,这个时候,我们项目的作用在市场中便完整的展现了出来,但其啊有许多大学生对自己的能力估计不足,一心想进大厂,但是最后都以失败告终,通过我们的项目,也能都在毕业之前便对自己的实力有一个清楚的认知,能来了解到自己的能力到底价值多少的薪水,在毕业之后抉择工作的时候也能够做出准确的抉择。

  我之前有在网上看到这么一句话“寒冬不是深渊,而是阶梯,是通往春天的阶梯。”对我们在校的大学生来说,这就是一种阶梯,能让我们知耻而后勇,寒假期间,回想过去的2018年,扪心自问,自己到底收获了什么,自己的目标又去实现了多少。

内容版权声明:除非注明,否则皆为本站原创文章。

转载注明出处:https://www.heiqu.com/wpzyyf.html