??b??jj5k?1,j?1,2,3,4为主成分的信息贡献率,
k?p?????k?1k?14pkk为主成分的累积贡献
率。经SPSS软件计算得到累计贡献率为0.99976,达到符合要求。 (7):计算综合得分:Z??bjj?1pyj,其中:bj为第j个主成分的信息贡献率,
根据综合得分值就可以进行评价。经SPSS软件计算得到各时刻的信息贡献率和和综合得分如下表:
表3
(8):评价现行的分时购票策略是否合理并且优化:从表3中可以看出,各时段的综合得分前两个数据明显大于后面的数据,并且第一个数据又明显大于第二个数据,后面的数据相对比较均匀,由此可以得出现行的分时购票策略不合理,应该让18:00时刻和11:00时刻火车起售车数量均匀分给其他时刻,并且重新调整分时购票策略如下:
8:00、9:00、11:00、12:00、13:00、15:00、16:00、17:00、18:00. 5.32(优化后重新计算第二问的问题) 根据优化的分时策略,经Matlab软件编程(部分程序见附录3.1)重新模拟2013年1月17日的网站订票请求量数据(部分见附录3.2),计算出共需要
61+75+1155+554+514+71+73+87+13904=16494 队列可以满足需求。
5.4给出建议书
2011年年底,中国铁路开始全面实行网上售票。然而网络购票给广大客户带来便利的同时,也相继出现了不少问题。归根结底,还是需要提升12306网站的体验,做好应急预案,才是王道。现建议如下:
建议一:目前用户进入车票预定页面所默认的起始时间是当日,其实在春运期间,可以默认的是最早订到车票的日期,服务好急于订票的用户最贴心。
建议二:在12306的乘车人姓名、座位席别要在预定了再选,建议预先选定,并且自动记忆,这样用户上次没买到,下次系统还记得,直接点击确认就可以继续购票了。其实就是让网站更“聪明”些,自动知道用户要买哪天、哪趟车的票。 建议三:网上购票流程,查询-》预定-》确认-》完成,这样的操作逻辑更适合
9
售票员,不适合网民的习惯,完全是照搬线下窗口售票。建议做做数据挖掘,把用户常买的车次记录下来,然后用户一登进去,就应该显示用户最常买的那些车次。
建议四:往返这个需要走两遍预订的流程,目前需要选两遍,乘车人,输入两遍验证码,进行两次验证,建议可以合并为一次预订。
六、模型的评价与推广
6.1优点
算法的精确度较高,具有很好的稳定性和可信度。对于参数估计模型,极大似然法是对总体参数?作点估计的一个较好的方法,其优点是无论在白噪声干扰或有色噪声干扰下,都有良好的统计特性。对于蒙特卡罗模型,蒙特卡罗模拟方法的优点是能够比较逼真地描述具有随机性质的事物的特点及物理实验过程,受几何条件限制小,收敛速度与问题的维数无关,误差容易确定,程序结构简单,易于实现。对于主成成分分析模型,主成成分分析法的优点是可消除评价指标之间的相关影响,可减少指标选择的工作量,当评级指标较多时还可以在保留绝大部分信息的情况下用少数几个综合指标代替原指标进行分析, 在综合评价函数中,各主成分的权数为其贡献率,它反映了该主成分包含原始数据的信息量占全部信息量的比重,这样确定权数是客观的、合理的,它克服了某些评价方法中认为确定权数的缺陷。 这种方法的计算比较规范,便于在计算机上实现,还可以利用专门的软件。 6.2缺点
对于参数估计模型,极大似然法最终要归结为是似然函数值为最大的最优化问题,这就往往得不到解析解,只能采用数值解法,所以计算工作量较大。对于蒙特卡罗模拟模型,蒙特卡罗方法的缺点是收敛速度慢,误差具有概率性,进行模拟的前提是各输入变量是相互独立的。对于主成成分分析模型,在主成成分分析中,我们首先应保证所提取的前几个主成分的累计贡献率达到一个较高的水平(即变量降维后的信息量须保持在一个较高水平上),其次对这些被提取的主成分必须都能够给出符合实际背景和意义的解释(否则主成分将空有信息量而无实际含义)。其次主成分的解释其含义一般多少带有点模糊性,不像原始变量的含义那么清楚、确切,这是变量降维过程中不得不付出的代价。因此,提取的主成分个数m通常应明显小于原始变量个数p(除非p本身较小),否则维数降低的“利”可能抵不过主成分含义不如原始变量清楚的“弊”。 6.3推广
极大似然估计法在不同概率问题中应用很多,当然它还可以作用在其他方面,比如应用极大似然法分析质量-数量性状遗传,估计信号频率等。 蒙特卡罗方法所特有的优点,使得它的应用范围越来越广。它还可以应用在粒子运输问题,统计物理,典型数学问题,真空技术,激光技术以及医学,生物,探矿等方面,特别适用于在计算机上对大型项目、新产品项目和其他含有大量不确定因素的复杂决策系统进行风险模拟分析。随着科学技术的发展,其应用范围将更加广泛。
10
主成成分分析法是一种降维的统计方法,它可以用尽量少的综合指标代替众多的原始数据,并尽可能多地反应原始数据所提供的信息,是一种方便、快捷和准确的量化评价功能学特性的新方法,它可以应用于保健食品功能学评价的研究,评价保健食品的功能特性对抗疲劳和耐缺氧的作用。其次主成成分分析还可以作用其他众多领域。在近红外光谱中、食品品质方面、核磁共振技术中、滴定分析中都可以应用。
七、参考文献
1、苏均和主编:概率论与数理统计,上海财经大学出版社.1999年1版. 2、茆诗松等编著:概率论与数理统计,中国统计出版社.1999年1版.
3、魏振军编:概率论与数理统计三十三讲,中国统计出版社.2000年1版. 4、唐生强主编:概率论与数理统计复习指导,科学出版社.1999年1版. 5、参数估计:百度百科
6、司守奎等编著:数学建模算法与应用,北京国防工业出版社,2011年1版 7、张德丰等编,MATLAB高级语言编程,机械工业出版社,2010年01月。
八、附件
附录一
%%%%%%%%%%%%%%%%%%%%参数估计:正态分布的最大似然估计程序 clc,clear
A1=[220 159 109 89 101 100 111 111 166 150 164 116 122 101 101];%处理数据个数
A2=[0.0591 0.0503 0 0 0.0099 0.01 0 0 0.0602 0.0867 0.122 0.0259 0.0246 0.0099 0.0198];%对应的错误率
[muhat,sigmahat,muci,sigmaci]=normfit(A1,0.05)%正态分布的最大似然估计,置性度为?的置性区间
[muhat,sigmahat,muci,sigmaci]=normfit(A2,0.05)%同上,返回显著性水平为0.05的期望,方差值,和置性区间
11
附录二
2.1 8:00时刻
网站订票请求8:00时刻 量数据
1 2 3 4 5 6 7
805 824 831 827 837 836 822
8 9 10 11 12 13 ……
网站订票请求量数据 833 823 836 827 838 838 ……
2.2
%%%%%%%%%%%%%%蒙特卡洛程序 clc,clear
%%%%%%%%%%%%8:00网站访问量数据 N0=61250;
No1=round(N0/1000);%计算需要多少个队列可以满足需求 for i=1:No1
D=0.12;%错误率初始值 t=32;%队列排队时间初始值 while D>=0.1&&t>30%循环判断
A=round(1+(4-1)*rand(1000,1));%获取号码次数 B=0.07*rand(1000,1);%获取号码耗时
12

