做网站设计挣钱吗,wordpress 最后修改时间排序,代做网站公司哪家好,怎么办?0 前言
#x1f525; 优质竞赛项目系列#xff0c;今天要分享的是
#x1f6a9; 基于yolov5的深度学习车牌识别系统实现
#x1f947;学长这里给一个题目综合评分(每项满分5分)
难度系数#xff1a;4分工作量#xff1a;4分创新点#xff1a;3分
该项目较为新颖 优质竞赛项目系列今天要分享的是 基于yolov5的深度学习车牌识别系统实现
学长这里给一个题目综合评分(每项满分5分)
难度系数4分工作量4分创新点3分
该项目较为新颖适合作为竞赛课题方向学长非常推荐 更多资料, 项目分享
https://gitee.com/dancheng-senior/postgraduate 1 课题介绍
近年来大数据的受关注程度越来越高。如何对大数据流进行抽取转换成有用的信息并应用于各行各业变得越来越重要。如今校园一卡通系统在高校应用十分广泛大部分高校主要利用校园一卡通对校园中的各类消费阅、补助领取等进行统一管理。通过数据分析算法,对大学生校内消费记录进行整理、分类、预测,从而整体反应学生在校消费情况,形成量化的评判标准,同时也为今后的贫困生资助管理工作提供可靠的数据支持,辅助完成贫困生的相关工作。
2 数据预处理
在进行数据挖掘或者数据分析之前,需要对“脏数据” 数据进行数据预处理,一般采用数据清理、数据集成、数据变换等方式,已获得更好的分析效果。
2.1 数据清洗
由于数据库中有着大量的数据表我们获取到的数据表中会存在着异常数据如数据不合法与常识不符同一个字段属性值来源于多张数据表且数值不一样等。数据预处理主要去处可忽略的字段、忽略空缺记录、可处理噪声的数据、可删除的数据等。由于部分校园卡用户,如教职工、研究生等,消费时具有很强的随机性和离散型。同时为了保护隐私对姓名、学号等属性要做脱敏和隐私处理。
2.2 数据规约
预处理后的数据不一定适合直接使用因此需要对数据进行集成和变换将多个数据库中提取出的数据项整合到一起组成新的数据集环境并经过详细对比和筛选解决数据不一致和数据冗余等问题。为了适合分析我们要对数据进行离散化和概念分层处理。
3 模型建立和分析
通过建立消费数据分析模型对学校校园卡消费行为进行分析总结学校学生
#1.总体消费情况 #2.不同专业、性别的学生与消费能力的关系 #3.不同性别的学生与消费项目的关系 #4.消费时间的特征分析 #5.消费地点与门禁通过地点的关系分析 #6.学生消费特征分层模型 import matplotlib.pyplot as pltexpen_rec pd.read_csv(rC:\Users\River\Desktop\校园卡数据\expen_rec.csv,encodinggbk)student pd.read_csv(rC:\Users\River\Desktop\校园卡数据\student.csv,encodinggbk)access pd.read_csv(rC:\Users\River\Desktop\校园卡数据\access.csv,encodinggbk)all_data1 pd.merge(expen_rec,student,on 校园卡号,howleft)all_data1.head()3.1 不同专业、性别的学生与消费能力的关系 from pylab import *plt.rcParams[font.sans-serif][SimHei]%matplotlib inlinetotal con_sum.groupby([性别])[[消费金额]].sum()total1 con_sum.groupby([性别])[[消费金额]].count()plt.subplot(121)plt.pie(total[消费金额],labelstotal.index,autopct%2.f%%)plt.title(男女生消费总金额对比)plt.subplot(122)plt.pie(total1[消费金额],labelstotal1.index,autopct%2.f%%)plt.title(男女生人数对比)plt.show() fig1 plt.figure(num 1, figsize(8,4))plt.title(各消费等级人数)plt.xlabel(消费等级)x1 [(0, 100] ,(100, 150],(150, 200] ,(200, 250],(250, 300],(300, 350],(350, 400],(400, 500],(500, 3000]]y1 list(table1.values)y2 list(table2.loc[(女,slice(None))].values)y3 list(table2.loc[(男,slice(None))].values)plt.plot(x1,y1,label总体)plt.plot(x1,y2,label女生)plt.plot(x1,y3,label男生)plt.legend(loc2)plt.show() #分析各专业总消费金额排列fig2 plt.figure(num 2, figsize(14,6))plt.title(各专业总消费金额排列)plt.xlabel(专业名称)x1table3.indexy1table3[消费总金额]plt.bar(x1,y1)plt.xticks(x1,x1,rotation45)for a,b in zip(x1,y1):plt.text(a, b0.05, %.0f % b, hacenter, va bottom,fontsize9)plt.show()小结
1.该校18级学生的人均每月校园卡消费295.96元
2.女生人数占比59%总消费额占比56%消费总金额与性别差异不大
3.从消费金额级区间上看学生的总体消费金额主要在[200500]的区间内但男女生消费存在明显差异女生消费金额在[200-350]区间内人数明显高于男生但随着增加而下降而男生在400以上的区间内的人数高于女生。男生对校园卡消费方式差异较大一般不使用或者经常使用。女生多数选择轻度使用。
4.从各专业消费总金额上看机械制造专业最高机械制造学徒专业最低。但结合各专业的人均消费分析各专业的人均消费差异很小标准差仅为42.8。人均消费最高的机械制造学徒专业因为人数最少仅为14人对总体数据影响较小。可以得出学生的校园卡消费能力与专业无明显区别。
3.2 消费时间的特征分析 fig7 plt.figure(num 7, figsize(8,4))mon1 time_tab.groupby([日期])[[消费金额]].count()mon2 time_tab1.groupby([日期])[[消费金额]].count()mon3 time_tab2.groupby([日期])[[消费金额]].count()plt.title(月度消费次数趋势分析)plt.xlabel(日期)x1 list(mon1.index)y1 list(mon1.values)y2 list(mon2.values)y3 list(mon3.values)plt.plot(x1,y1,label总体)plt.plot(x1,y2,label女生)plt.plot(x1,y3,label男生)plt.legend(loc2)plt.show()#除个别天数外女生均高于男生每周之间趋势相似 fig8 plt.figure(num 8, figsize(8,4))wk1 time_tab.groupby([星期])[[消费金额]].count()wk2 time_tab1.groupby([星期])[[消费金额]].count()wk3 time_tab2.groupby([星期])[[消费金额]].count()def autolabel(rects):for rect in rects:height rect.get_height()plt.text(rect.get_x()rect.get_width()/2.-0.2, 1.03*height, %s % float(height))plt.title(月度消费次数趋势分析)plt.xlabel(星期)y1 wk2[消费金额]y2 wk3[消费金额]x1range(len(y1))x2[i 0.35 for i in x1]aplt.bar(x1,y1, width0.3,label女生,colorblue)bplt.bar(x2,y2, width0.3,label男生,colorgreen)autolabel(a)autolabel(b)plt.legend()plt.xticks(x1,list(wk1.index),rotation45)plt.show()#周一至周三消费次数较高男女生在一周内的消费频率的波动没有明显差异1.从一个月的每天的消费次数上看除个别天数男女生消费次数相近多大多数天数的女生的消费次数高于男生且每周之间趋势相似可以得出学生日常的消费习惯比较稳定
2.从每周的消费次数汇总上看周一至周三消费次数较高并且逐步下降周末为消费次数最低的时候。男女生在一周内的消费频率的波动趋势相同没有明显差异
3.从每天的消费的时间段分析上看周末的刷卡消费次数为平常的12%。食堂可以根据数据情况适当安排休息减少人力成本浪费
4.平常时间的早、中、晚餐的用餐时间集中在7点、11点、17-18点时间段。周末消费的时间相对平缓早餐的高峰时间会延后到8点时间段且持续有人员消费中餐的用餐时间也会有部分后延到12点的时间段。晚餐时间则会部分提前17点的时间段进行需要提前做好食堂的准备事项。
4 Web系统效果展示
以上是校园卡分析的部分过程我们还可以做成web系统来展示。效果如下
4.平常时间的早、中、晚餐的用餐时间集中在7点、11点、17-18点时间段。周末消费的时间相对平缓早餐的高峰时间会延后到8点时间段且持续有人员消费中餐的用餐时间也会有部分后延到12点的时间段。晚餐时间则会部分提前17点的时间段进行需要提前做好食堂的准备事项。
Web系统效果展示
以上是校园卡分析的部分过程我们还可以做成web系统来展示。效果如下 5 最后 更多资料, 项目分享
https://gitee.com/dancheng-senior/postgraduate