黄 莉,刘丁酉
(1.武汉商学院 信息工程系, 湖北 武汉 430056;2.武汉大学 数学与统计学院, 湖北 武汉 430072)
利用MySQL研究公共自行车服务系统
黄 莉1,刘丁酉2*
(1.武汉商学院 信息工程系, 湖北 武汉 430056;2.武汉大学 数学与统计学院, 湖北 武汉 430072)
公共自行车作为一种低碳、环保、节能、健康的出行方式,正在全国许多城市迅速推广与普及.2013年9月高教社杯全国大学生数学建模竞赛的D题就关注了公共自行车服务系统,该题以浙江省温州市鹿城区公共自行车管理中心提供的某20天借车和还车的原始数据作为参考,利用关系数据库MySQL为工具对这些数据进行处理和分析,研究该区公共自行车服务系统的运行规律,由此对该系统作出评价和建议,以期为其他地区公共自行车服务系统的运行和维护提供一些参考依据.
公共自行车服务系统;MySQL;数据
图1 数据概念模型
本文中参考数据为2013年高教社杯全国大学生数学建模竞赛的D题中浙江省温州市鹿城区公共自行车管理中心(http://www.wzbicycle.com)[1-2]提供的某20天借车和还车的原始数据.基于对原始数据的分析,可以看到题目中的数据是一种关系型结构,采用关系数据库作为工具来分析数据,是最合适的选择.
可以使用Sybase公司的建模工具PowerDesigner工具,建立如图1数据概念模型.关系数据库种类众多,当前比较流行的有:Oracle、DB2、SQL Server、MySQL等.MySQL是当前最流行的、开放源码的关系型数据库管理系统[3-4],并且数据库服务器具有快速、可靠和易于使用、总体拥有成本低的特点.因此本文采用MySQL作为数据库工具来存储数据,并将基于MySQL数据库,采用SQL语言编程来完成数据分析工作.
为得到公共自行车服务系统的有用信息,基于数据模型建立数据库,数据库名称leo_schema,然后根据数据关系建立数据视图day_data,day_data结构与题目中提供的数据结构保持一致.从以下几个方面来分析数据:
1) 分别统计各站点20天中每天及累计的借车频次和还车频次.
编写SQL查询语句:
Select count(*) 累计借车次数,d.day,d.借出车站
FROM leo_schema.day_data d
group by d.day,d.借出车站
order by cast(d.day as unsigned int) ,cast(count(*) as unsigned int);
由此得到各站点每天的借车频次、还车频次,以及各站点20天累计的借车、还车频次,并按从小到大顺序排列出来.分析结果发现,各站点累计借还自行车的次数相差非常大,因此各站点的规模设置要根据实际用车需求来调整.从整体的20天累计统计,借车频次和还车频次较多的站点基本上比较固定,比如街心公园、五马美食林、开太百货、体育中心西、医学院等;而从具体的每一天的统计数据来看,使用较多的站点基本上也是上述这些,但是在个别天里,有些站点的使用率也较高,比如银泰百货,这说明除了稳定的使用率高的站点需要增加站点规模外,有些人流量大的商业区里面的一些站点也需要考虑临时性较高的使用率,就需要管理方采取相应的措施来应对这种情况.
2)统计每次用车时长的分布情况.
将用车时长的数据梳理一下,发现有116个数据用车时长为0,这些数据视为借车违规未还数据或者是问题数据和特殊数据,这些数据在这个问题中不予考虑.
编写程序:Select count(*) 借车次数
From (
Select d.day,d.车号,
date_format(d.还车时刻,'%Y-%m-%d %H:%i:%s') 还车时刻 ,
date_format(d.借车时刻,'%Y-%m-%d %H:%i:%s') 借车时刻,
timediff(date_format(d.还车时刻,'%Y-%m-%d %H:%i:%s') ,
date_format(d.借车时刻,'%Y-%m-%d %H:%i:%s')) 借车使用时间
FROM leo_schema.day_data d
) base
where base.借车使用时间 >'00:00:00' and base.借车使用时间 <= '00:05:00'
将用车时长按5 min一个间隔统计,得到用车时长在5~10 min的使用次数为最多,占到25.8%,其次是10~15 min的占到20.8%,0~5 min的占到15.7%,并且在1 h内,随着用车时长的增加,租借公共自行车的次数反而减少,说明这些使用者基本上都是在短距离的情况下选择公共自行车作为出行方式,对于路程太远的地方,大部分人还是会选择公交车或者是出租车.同时发现租用公共自行车的市民中90.2%的用车时长不超过30 min,而98.9%的市民租用自行车的用车时长不会超过1 h,也就是免费租用公共自行车,仅有1.05%的市民用车时长在1~4 h,需要付费租用,而有0.05%的市民没有遵守规定在4 h之内归还公共自行车.因此,绝大部分使用者都是免费享用了政府这项便民惠民措施,但同时这块财政支出也是较大的,可以考虑在站点里面以及公共自行车周身做一些商业广告来贴补支出.另外也有极少使用者没有遵守规定按时归还自行车,甚至将公共自行车遗失、公车私用,那么管理方应该制定相应措施来制约和惩罚这部分使用者.
3)统计20天中每天使用公共自行车的不同借车卡(即借车人)数量,并统计数据中出现过的每张借车卡累计借车次数的分布情况.
20天中每天使用公共自行车的不同借车人的数量很容易统计出来,如果以天数为横坐标,不同借车人数为纵坐标,建立每天不同借车人数的变化折线图,就会发现每天不同借车人数随天数不同,起伏很大,但大致规律为7天一个周期循环,在一个星期内,变化规律相似.每个周末内借车人数会出现最低值,而在周一开始显著增多,工作日的几天借车人数相对平稳,这就表明租借公共自行车的人群可能大部分为上班族.每个星期的最高值基本差不多,但每个星期的最低值却不一样,其最低值不同可能受天气等临时性的因素所影响.
统计数据中每张借记卡累计借车次数的分布情况,发现每天租借公共自行车1~2次的人数最多,所占比例高达70%以上,而租借次数4次以上的所占比例不足10%,由此可见自行车的使用人群比较稳定,主要为上班族,这些上班族使用自行车的主要目的是用来上下班.总体来看使用的目的过于单一,公共自行车利用率不高,所以政府还需要继续倡导和鼓励其他人群使用公共自行车,让使用目的变得多样化,公共资源的利用率更高.
统计在20天内累计借车次数的情况分布,发现20天内累计用车次数最多的一张借记卡,用车次数也才为25次,而且20天内累计用车次数大于等于10次的借记卡占所有使用过的借记卡的比例仅为1.9%,甚至近一半的借记卡20天内来偶尔使用一次.因此这些使用者都是不固定、偶尔使用自行车的,有很多使用者还没有真正依赖公共自行车作为出行方式,说明对低碳环保的绿色出行方式的宣传力度还需加大,同时也说明公共自行车可能在很多时候还不能满足市民需求,有必要进一步改进.
4)针对使用公共自行车次数最多的一天(即为第20天),再从以下几个方面具体分析:
①对借还车是同一站点且使用时间在1 min以上的借还车情况进行统计.在这里不考虑借还车是同一站点且使用时间在1 min以内的数据,因为如果取公共自行车的平均速度为15 km/h的话,1 min以内的路程在250 m以内,这个距离在没有公共自行车租借时完全可以步行.统计借还车是同一站点且使用时间在1 min以上的站点累计使用次数,按从大到小的顺序排列下来,位列前五名的分别为:五马美食林58次、县前头47次、体育中心西46次、阳光花苑42次、国际大酒店40次.由于该地区每个站点的锁桩数量大概为30个,那么针对这几个站点需要增加锁桩才能使市民租借公共自行车的满意度最大.
②针对借车频次最高和还车频次最高的站点,分别统计分析其借、还车时刻的分布及用车时长的分布.
统计出来借车频次最高的站点为街心公园,其借车高峰时刻发生在下午5~6点,用车时长主要集中在20 min以内,所占比例达79.2%,并且用车时长在40 min以内的高达96.2%;还车频次最高的站点为五马美食林,其还车高峰时刻发生在下午5~6点,用车时长主要集中在20 min以内,所占比例达78.6%,并且用车时长在30 min以内的高达93.1%.因此可以考虑在这两个站点的借还车高峰时段增派服务人员,以便最大程度满足市民的用车需求.
③找出各站点的借车高峰时段和还车高峰时段.
Select count(*) 借车次数 ,base.借出车站, base.借车小时
From (
Select substr(d1.借车时刻,1,13) 借车小时, d1.*
FROM leo_schema.day_data_v_test d1
where d1.day = 20
and d1.还车车站号<> 0
)base
group by base.借出车站, base.借车小时
order by base.借出车站,cast(count(*) as unsigned int) desc, base.借车小时
通过以上程序得到各借车车站的高峰时刻和其最高借车频次,发现借车高峰时段主要集中在07:00-09:00和17:00-18:00,分别占到30.4%和56.1%;同样的可以得到,还车高峰时段主要集中在08:00-09:00和17:00-18:00,分别占到42.0%和46.7%.从以上结果可以看出,使用公共自行车都比较集中在上下班时间段,而在中午等其他时段用车频次比较少.因此,在上下班这段高峰期会出现借还车困难的现象,有必要根据各站点的借还车频次来更加合理地设置每个站点的大小和锁桩的配置.
目前全国有许多地区都在建设公共自行车服务系统,但或多或少都存有缺陷和不足.本文以鹿城区的公共自行车服务系统为例,针对原始数据从几个方面找出一些有用的信息,来说明该系统在使用中需要注意的问题,以期为别的地区建立和完善该系统做出一定的参考.根据国内外公共自行车服务的成功经验,公众对于“绿色出行”具有巨大的需求.只要服务站点分布合理、借还车手续便捷、车辆维护及时,人们十分愿意采取这种环保而健康的出行方式.因此,只要因地制宜地不断完善公共自行车服务系统,这样一项便民惠民政策一定能真正深入人心、落到实处.
[1]全国大学生数学建模竟赛[EB/OL].(2013-09-13)[2013-09-15].http://special.univs.cn/service/jianmo/index.shtml.
[2]2013高教社杯全国大学生数学建模竞赛赛题[EB/OL].(2013-05-25)[2013-05-27].http://special.univs.cn/service/jianmo/sxjmtmhb/2013/0525/969401.shtml.
[3]王志刚.MySQL高效编程[M].江友华译,北京:人民邮电出版社,2012:9-11.
[4]王珊,萨师煊.数据库系统概论[M].北京:高等教育出版社,2006:12-28.
责任编辑:时凌
ResearchonthePublicBicycleServiceSystembyMySQL
HUANG Li1,LIU Ding-you2*
(1.Department of Information Engineering,Wuhan Business University,Wuhan 430056,China;2.School of Mathematics and Stastitics, Wuhan University, Wuhan 430072,China)
Public bicycle as a low-carbon,environmentally friendly,energy-saving,healthy way to travel,is promoted in many cities.The public bicycle service system was concerned in 2013 CUMCM D problem.In this paper,the origin data provided by public bicycle management center of Lucheng district was used as a reference,then the operating rule of public bicycle service system was researched by using MySQL to process and analyze the data,in order to provide some reference for the construction of public bicycle service system in other areas.
public bicycle service system;MySQL;data
2014-01-23.
2013年度武汉市属高校教学研究项目(2013132).
黄莉(1984- ),女,硕士,讲师,主要从事矩阵分析及其应用研究;*
:刘丁酉(1957- ),男,博士,教授,主要从事矩阵分析及其应用的研究.
TP393
A
1008-8423(2014)01-0078-03