中国人口增长预测数学模型

| 中考作文预测 |

【www.longjiam.com--中考作文预测】

中国人口增长预测模型

张金漫(信息安全)段胜安(信息对抗技术)冯玉峰(信息对抗技术)

全国一等奖

摘要

本文对中国的人口增长趋势问题做了研究,根据中国人口特点以及对人口中

短期及长期预测的需要建立了3个预测模型。

对于人口的中短期预测,本文建立离散中国人口发展模型和连续中国人口发

展模型。

离散中国人口发展模型首先根据中国人口发展所呈现的出生人口性别比持

续升高,老龄化进程加速的特点对宋健人口发展模型中的静态出生人口性别比和各年龄段死亡率引进时间参数t,使其动态化。并用灰色预测模型对这两个参数进行2006-2010年的短期预测。然后将参数的预测值代入中国人口发展模型,得到2006-2010年各个地区各年龄不同性别的人口数量的预测。2010年,城市,城镇,乡村的男性的人数分别将达到1.84,1.50,3.94亿;女性人口数量将达到

1.83,1.33,3.81亿;中国总人口总数将达到13.6亿.最后对得到的结果进行检验以及人口地区差异,性别差异,年龄结构差异的分析和比较,对中国的人口发展形势进行一定的研究。

连续中国人口发展模型首先将影响人口数量的参数进行分段拟合,以区分劳

动力与非劳动力的不同波动,使数据具有我国人口的特色。同时在拟合的过程中加入了时间序列,随机过程的因素,使得回归的曲线与实际数据更加贴合,提升了精确度。

对于人口的长期趋势预测,本文采用了Leslie人口预测模型,预测城市总

人口50年的发展趋势,得到在2033年人口数量达到峰值,然后趋于稳定。进而又提出了改进模型,将Leslie模型与线性回归模型相结合,分段预测人口。

关键词:中国人口发展模型,灰色GM(1,1)预测,Leslie模型,分段拟合预测

1、问题的背景、重述

1.1问题背景:

我国是一个人口大国,人口问题始终是制约我国发展的关键因素之一。人口数量的飞速增长,严重影响了我国经济和社会的发展,预测人口数量和发展趋势是我们制定一系列相关政策的基础。因此怎样更好地预测人口数量,结构,分布,劳动力,负担系数还有人口的出生率、死亡率、增长率等等,通过控制这些参数来控制人口数量提高经济和社会的发展是摆在我们面前亟待解决的问题。目前,我国的人口发展又出现了新的特点:老龄化进程加速、出生人口性别比持续升高,乡村人口城镇化等,所以人口问题更加严峻和义不容辞。

1.2问题重述:

我国是一个人口大国,人口问题始终是制约我国发展的关键因素之一。根据已有数据,运用数学建模的方法,对我国人口做出分析和预测是一个重要问题。

近年来我国的人口发展出现了一些新的特点,例如,老龄化进程加速、出生人口性别比持续升高,以及乡村人口城镇化等因素,这些都影响着中国人口的增长。

关于我国人口问题已有多方面的研究,并积累了大量数据资料。

试从我国的实际情况和人口增长的上述特点出发,参考附录2中的相关数据(也可以搜索相关文献和补充新的数据),建立我国人口增长的数学模型,并由此对中国人口增长的中短期和长期趋势做出预测;并且指出模型中的优点与不足之处。

2、模型的基本假设与符号说明

2.1基本假设:

1.中短期预测年限为5年,长期预测年限为50年。

2.中国统计年鉴给出的统计数据基本准确,但是也有误差,所以对预测数据存在一定的误差可以接受

(还有一些具体的假设在各模型中进行具体说明)

2.2符号变量说明:

p(r,t)……………………………………..t时刻年龄为r的人数

p1(r,t)…………………………………….t时刻年龄为r的男性人数

p2(r,t)…………………………………….t时刻年龄为r的女性人数

s(r,t)…………………………t时刻年龄为r的人数的存活率(下标表示含义同上)

m(r,t)………………………………………t时刻年龄为r的人数的死亡率(同上)g(r,t)…………………………………….t时刻年龄为r的人的净迁入人数(同上)b(t)…………………………………………t时刻的出生人数(同上)

δ(f,t)……………………………………….t时刻女婴的出生比率

δ(m,t)……………………………………….t时刻男婴的出生比率

h(r,t)…………………………………………t时刻年龄为r的妇女的生育率

(还有一些具体的参数变量在各模型中进行具体说明)

3、离散中国人口发展模型

3.1问题背景的理解

人口的预测就是根据一个国家、一个地区人口的现状,考虑到社会政治经济

条件对人口再生产和转化的影响,分析其发展规律,运用科学的方法预测未来某个时期人口的发展状况。人口预测首先是针对人口数目,其次还可预测人口的出生率、死亡率、增长率以及人口性别和年龄构成。由于我国人口出现的新特点,还可以对未来人口的分布、婚姻状况、家庭构成、城乡人口比例等进行预测。人口的短期预测一般为(1—3)年、中期预测一般为(5—10)年、长期预测一般为(10年以上,可长达100年)。

3.2对宋健人口发展模型的分析

宋健人口发展模型:

b1(t)=∑p2(r,t)h(r)δ(m)

r1r2

?p1(0,t)=b1(t+1)+g1(0)?p(1,t+1)=p(0,t)s(0)+g(0)?1111??.....................................................

??p1(n,t+1)=p1(n?1)s1(n?1)+g1(n?1)

首先,可以看到该模型中δ(m),s1(n?1)是静止不变的,这不能体现当今中

国人口所呈现的性别出生比的上升和老龄化进程的特点。所以我们在提出的中国人口发展模型中对δ(m),s1(n?1)引进时间参数t,将其动态化为δ(m,t),s(r,t)。然后用灰色预测模型对这两个参数进行预测。

其次,进一步分析p1(0,t)=b1(t+1)+g1(0)项,其意思是该年出生的人在下一

年作为0岁的人数计算,而附录所给统计数据0岁所对应的是当年所出生的人数,所以宋健的人口发展模型是滞后一年的。我们将其修正为p(0,t+1)=s(0,t+1)b(t+1)+g(0,t+1)。

3.3灰色预测模型对δ(m,t),s(r,t)进行预测

3.31灰色预测模型GM(1,1)原理分析

灰色系统是指部分信息已知、部分信息未知的系统,灰色系统预测理论的基

本思路是将已知的数据序列按照某种规则构成动态的或非动态的白色模块。再按某种变换或解法来求解未来的灰色模型,在灰色模块中再按照某种准则,逐步提高白度,直到未来发展变化的规律基本明确为止。其基础是建立模型,通常为一阶单变量模型GM(1,1)和一阶多变量模型GM(1,n)。我们这里建立的是GM(1,1)模型。GM(1,1)模型是指一阶、一个变量的微分方程预测模型,是一阶单序列的线性动态模型,用于时间序列预测的是离散形式的微分方程模型。

设x(0)为n个元素的数列x(0)=(x(0)(1),x(0)(2),...,x(0)(n)),x(0)的累加(AGO)生

成数列为x(1)=(x(1),x(2),...,x(n)),其中x(k)=∑x(0)(i)(k=1,2,...,n)。定(1)(1)(1)(1)k

i=1

义x(1)的灰导数为

d(k)=x(0)(k)=x(1)(k)?x(1)(k?1)

令z(1)为数列x(1)的均值(mean)数列,即

z(1)(k)=0.5x(1)(k)+0.5x(1)(k?1)(k=2,3,...,n)

则z(1)=(z(1)(1),z(1)(2),...,z(1)(n)),定义GM(1,1)的灰色方程模型为:

d(k)+az(1)(k)=b

x(0)(k)+az(1)(k)=b(1)

其中x(0)(k)称为灰导数,a称为发展系统,z(1)(k)成为白化背景值,b称为灰作用量。

对于GM(1,1)的灰微分方程(1),如果将x(0)(k)的时刻k(k=2,3,...,n)视

为连续的变量t,则数列x(1)就可以看成时间t的函数,记为x(1)(t)。于是得到GM(1,1)的灰微分方程对应的白微分方程为

dx(1)

+ax(1)(t)=bdt

称之为GM(1,1)的白化型。

将时刻k=2,3,...,n代入(1)式中有

?x(0)(2)+az(1)(2)=b?(0)(1)?x(3)+az(3)=b??......

?x(0)(n)+az(1)(n)=b?

??z(1)(2)1??(1)??z(3)1?,称Y令YN=(x(0)(2),x(0)(3),...,x(0)(n))T,u=(a,b)T,B=?N?......??(1)??z(n)1????

为数据向量,u为参数向量,B为数据矩阵,则GM(1,1)可以表示为矩阵方程(2)YN=B?u

对于参数u的确定方法:

?)=(YN?B?u?)T(YN?B?u?)如果存在(BT?B)?1,由最小二乘法,求使得J(u

?)T=(BT?B)?1?BTY。?=(a?,b达到最小值的uN

?=aCD?(n?1)E,2(n?1)F?C

n?=bDF?CE(n?1)F?C2n

其中:C=∑z(k),D=∑x(k),E=∑z(k)?x(k),F=∑(z(1)(k))2。(1)(0)(1)(0)nn

k=2k=2k=2k=2

于是求解方程(2)得

bbx(1)(k+1)=(x(0)(1)?)e?ak+,(k=1,2,3,...,n)aa(3)

而且?(0)(k+1)=x?(1)(k+1)?x?(1)(k)(k=1,2,3,...,n)x

(4)式(4)即为预测的计算式。

检验预测值:

残差检验,令残差为ε(k),计算

?(0)(k)x(0)(k)?xε(k)=x(0)(k),(k=1,2,...,n)

如果ε(k)

3.32对δ(m,t),s1(n?1)进行灰色预测

3.321计算δ(m,t)及检验

1.计算

根据中国人口人口统计年鉴中的统计数据,我们对城市各年份男性出生所占

比率情况用excel作图给出,如(图3.1)。

图3.1

观察图3.1,可以发现男性出生比率有一定的波动,但大致呈上升趋势。所以对

δ(m,t)在t=2006,2007……的值,我们采用灰色预测模型GM(1,1)的方法对未来男性出生率进行预测.根据表3.1,我们可以得到初始x0矩阵。

表3.1历年市男性出生所占比率

199419951996199719981999200020012002200320042005x0=[0.5338430.52810.5275890.52110.52530.52440.530510.5220.5268960.52840.533660.543]’

根据灰色预测的原理我们用matlab编程(附录1),得到2006年到2010年的市男性出生所占比率(表3.2)

表3.2预测市男性出生所占比率

2.检验20050.5273453200620070.52732960.5273169200820090.52730640.527297520100.52729

对δ(m,t)的残差检验

残差=0.4726

由于2006年的数据还未得到,在这里只能将2005年也作为预测值,然后对

真实值作比较得到残差,进行检验

残差=3.7274×10?5,预测较为准确

3.322计算s1(m,t)及检验

由于附录中所给的数据是死亡率m(r,t)的统计值,所以求s(r,t)可由s(r,t)=1?m(r,t)得到,对于m(r,t)的确定,我们用上述同样的方法来求解。

3.4对年龄别生育率h(r,t)的分析求解及检验

1.计算h(r,t)

根据中国人口人口统计年鉴中的2001—2005年统计的数据,我们对城市育龄

妇女的年龄别生育率的分布情况用excel作图给出,如(图3.41)。

图3.41

观察图3.41,可以发现在r=27附近生育率最高,向两边递减。生育率有随时间下降的趋势,但是在短期内(3年),下降不是很明显。综合分析这几年我国的发展比较稳定,所以在短期预测时,我们假设生育率水平随时间不变。而且根据其分布可以借用概率论中的Γ分布来对其表示

rr2?0?r?r?h(r)=?(r?r)a?1e?θ1,r2>r>r11?a??θΓ(a)

其中r1=15,r2=49并取θ=2,a=n/2[1]

根据h(r)的表达式,我们可以近似的得到h(r)序列。如(表3.41)

表3.41城市女性年龄别生育率

城市女性年龄别生育率(1/1000)

10160.033135.398460.326610760

20170.4963226.42470.258620770

30181.7083320.918480.252630780

40195.5963416.912490.352640790

502017.2083511.066500650800

602136.63367.97510660810

702258.56376.276520670820

802386.754384.496530680830

90393.218540690840

100402.288550700850

110411.342560710860

12027100.87420.98570720870

13

14

15

2.检验0002880.382964.8663048.174430.57440.438450.314585960000737475000888990000

在这里我们用s(t)表示h(r)相对于h(r,t)的偏差,(t=2001—2005)

令s(t)=,

然后得到如下检验表(表3.42):表3.42h(r)2001—2005年的偏差检验

2001

(1/1000)6.38024920022003200420053.318083.0489523.8717497.276267可以发现在偏差置信度为0.05的情况下,都可以通过检验。

3.5计算b1(t)及误差分析

1.计算b1(t)

根据b1(t)=∑p2(r,t)h(r,t)δ(m,t),又有step1,step2得到的h(r,t),δ(m,t),我们得

r1r2

到b1(t)的序列值。如(表3.51)

表3.51每年城市男性出生人数预测值

20012002200320042005

20062007200820092010

2.b1(t)的误差分析

表3.522001—2005年城市男性出生人数实际统计值

20012002200320042005

1479338表3.532001-2005年用预测方法计算得到的值

20012002200320042005

表3.54误差分析表

20012002200320042005-----------0.004142

观察表3.54我们看到误差是比较小的,有理由相信预测方法的准确性

3.6计算g(r,t)

由于人口的迁移比较复杂,统计的数据也未必准确,然后迁移率又是根据范围的不同而不同的,对中国所有的城市的统计,,城市之间的相互迁移可以抵消,这大大减少了迁移的人数,所以我们暂且假设g(r,t)=0。在后面对我国人口的城市化趋势中具体分析说明。

3.7中国人口发展模型的建立

以城市男性为例

b1(t)=∑p2(r,t)h(r,t)δ(m,t)

r1r2

?p1(0,t+1)=b1(t+1)+g1(0,t+1)?p(1,t+1)=p(0,t)s(0,t)+g(0,t)?1111??.....................................................

??p1(n,t+1)=p1(n?1)s1(n?1,t)+g1(n?1,t)

对城市女性,城镇男性和女性,乡村男性和女性可以用同样的方法建模。在这里不作详诉。

3.8模型的求解及误差分析

3.81模型的求解

根据模型年龄移算的方法,我们最终得到城市男性每年各年龄段的预测人数。如(表3.81)

(由于数据过多,我们将在附录中给出,这里只给出表头省略形式)表3.81

200120022003200420050---------1473211.31379460.71561200.61537152.31---------14430191463420133811615708892---------135709513112311310421117401789----------60704.6450715.1750605.5259836.5990031273.8828894.8228839.9928563.232006200720082009201001585000.81558144.11545704.81538477.21501508.11165646415757501548762153762915296612166570016556501575145154803615367588996551.2285674.76106913.5162375.7136606.5

9063438.9886253.2475593.3197273.3162375.7

根据表3.81,我们得到人口年龄结构发展变化图(图3.811和图3.812)

3.811

图3.812

图3.811中的系列1到系列9分别对应的是2002—2010年的人口情况,我们可以看到我国人口总体还处于增长趋势但增长率在降低,劳动年龄段人口(15

—64岁)占主导,说明我国还将处于一段人口红利区。3.82p1(r,t)的误差分析

通过与实际的2001—2005年的人口数进行误差分析,得到表3.82

表3.82误差分析表20012002200320042005。。。。。。同样观察误差,其值在可接受范围内

3.9对各地区不同性别各年龄段人口预测结果用图表的形式的进行综合分析3.91人口数

图3.911

图3.912

图3.913

3.914

图3.915

根据上图系列,我们可以清楚的看到:

1.在人口地区分布上,目前我国人口主要分布在农村,并将在一定时期内维持。

但是从农村人口发展的趋势上来看,其增长率是在减小的,而城市人口的增长率的趋势是在增加的。这一点体现了我国人口的城市化进程。

2.在性别比上,目前我国男性人数比女性多。这是由很多因素多导致的,其中有生物因素社会因素等。比如,由于y染色体的结合概率较大,导致我国男婴出生比较女婴高。再比如我国重男轻女的思想,致使男性出生和存活的概率比女性大。

图3.916

最后我们对上述数据相加,得到全国人口的预测图(图3.196),我们可以看到到2010年我国的人口数目将达到13.6亿。从人口增长趋势看,人口增长率在降低。这与我国的宏观调控和人民生活水平的提高是分不开的。3.92性别比出生率

表3.921市男

20010.522171

20020.526896

20030.528435

20040.533669

20050.532536

20060.527345

20070.52733

20080.527317

20090.527306

20100.527298

表3.922市女

20010.477829

20020.473104

20030.471565

20040.466331

20050.467464

20060.472647

20070.472662

20080.472675

20090.472686

20100.472695

表3.923

20010.53708

镇男

2002

20030.525999

20040.559277

20050.539616

20060.54094

20070.540901

20080.540869

20090.540842

20100.54082

0.551811

表3.924镇女

20010.46292

20020.448189

20030.474001

20040.440723

20050.460384

20060.459007

20070.459049

20080.459084

20090.459112

20100.459136

表3.925乡男

20010.54042

20020.549773

20030.547306

20040.549975

20050.547941

20060.545995

20070.545968

20080.545947

20090.545929

20100.545914

男性出生比比女性高,在地区分布上又呈明显的区域特性,乡村的男性出生比最大,城镇其次,最后是城市。这在一定程度上也反映了乡村的教育水平比较落后,封建思想还严重地存在.3.93高龄人口比率

表3.931城市男性

年份

老龄人口比率

20020.115707

20030.118907

20040.12837

20050.124188

20060.114344

20070.118604

20080.123408

20090.12837

20100.134976

表3.932城市女性

年份

老龄人口比率

20020.091837

20030.098042

20040.10327

20050.097855

20060.093935

20070.09795

20080.101559

20090.10572

20100.110024

表3.933城镇男性

20020.000312

20030.000283

20040.00028

20050.000482

20060.000443

20076.96E-05

20082.72E-05

20090.000153

20100.000103

表3.934城镇女性

年份

老龄人口比率

20020.00115

20030.001035

20040.000742

20050.001502

20060.001165

20070.000128

20080.000278

20090.000377

20100.000498

表3.935乡村男性

年份

老龄人口比率

20020.069669

20030.072302

20040.074304

20050.080896

20060.092929

20070.095683

20080.098516

20090.102104

20100.10581

表3.936乡村女性

年份

老龄人口比率

20020.080277

20030.082536

20040.084477

20050.091311

20060.101736

20070.104494

20080.107547

20090.110808

20100.114811

老龄人口所占比率有明显的上升趋势。

1.在地区分布上,可以看到城市的老龄人口所占比率比城镇和乡村的人大。这是地区的生活水平差异的结果。城市的生活水平比乡村和城镇高,所以城市

的人比较长命,由此得到城市老龄人口比乡村和城镇老龄人口比例大的预测结果。

2.在性别差异上,女的老龄人口所占比率要比男的大。3.94全国人口死亡,出生率

表3.941全国人口死亡率

年份2001200220032004200520062007200820092010死亡率(‰)6.436.416.46.426.516.45066.44936.44866.44816.4478

全国的死亡率在逐年减少,说明随着科学技术的发展,我国的卫生医疗水平和设施在逐年提高和改进,人的生活水平也在逐年提高。向低死亡率发展。

表3.942全国人口出生率

年份2001200220032004200520062007200820092010出生率(‰)14.0312.4112.2912.5436全国的出生率也在逐年减少,我国的计划生育政策是功不可没的。在加上生活水平的提高,国人的意识和思想觉悟已经有了一定的改变。

综合上面死亡率和出生率,可以看到我国正在向低出生率,低死亡率。低增长率的方向迈进。

4、连续中国人口发展模型

4.1参数说明

F(r,t).......................................................人口分布函数p(r,t).......................................................人口密度函数?(r,t).......................................................死亡率

p0(r).......................................................初始人口密度函数f(t).......................................................β(t).......................................................

单位时间生育率总和生育率

b(r,t).......................................................单位时间每人生育数h(r,t).......................................................生育模式

4.2模型建立

预测人口数量无非是想要求得一种函数,将时间带入后可以得到相应的人口数。这里假设有此种函数F(r,t),他表示在t时刻,年龄小于r的人口数量。可以

知道,F是随着r增大的非递减函数。

对F取导数,将其定义为人口密度函数

?F

p(r,t)=

?r则p(r,t)dr表示时刻t年龄在[r,r+dr]内的人数。

记?(r,t)为时刻t年龄r的人的死亡率,则?(r,t)p(r,t)dr表示t时刻年龄在

[r,r+dr]内单位时间的死亡人数。

为了得到p(r,t)满足的方程,考察时刻t年龄在[r,r+dr]的人到达时刻

t+dt的情况。他们中活着的那一部分人的年龄变为[r+dr1,r+dr1+dr],这里

dr1=dt。而在dt的这段时间里死亡的人数为?(r,t)p(r,t)drdt。于是

p(r,t)dr?p(r+dr1,t+dt)dr=?(r,t)p(r,t)drdt两边同时除以drdt,得到

?p?p+=??(r,t)p(r,t)?r?t

这是人口密度p(r,t)的一阶偏微分方程,其中死亡率??(r,t)为已知函数。

求定结条件:初始密度函数p(r,0)=p0(r),即是求数据表格中第一年的各年龄人数与年龄的关系。单位时间出生率p(0,t)=f(t),也称为婴儿出生人数,即时刻t年龄为0的人口数量。则数学模型为如下:

F(r,t)=∫p(s,t)ds

r

??p?p

??r+?t=??(r,t)p(r,t)?

?p(r,0)=p0(r)?p(0,t)=f(t)??

t,r>0

这个连续型人口发展方程描述了人口的演变过程,从这个方程确定出密度函数p(r,t)后,立即可以得到各个年龄段的人数,即人口分布函数。在社会安定的前提下,死亡率与时间关系并不明显,所以假设?(r,t)=?(r)则偏微分方程的解为:

?∫?(s)ds?r?t

p(r?t)e?0

p(r,t)=?r

?∫?(s)ds

?0r

0≤t≤r

下面对f(t)进行进一步分解。

记女性性别比函数为k(r,t),即时刻t年龄在[r,r+dr]的女性人数为

k(r,t)p(r,t)dr

将这些女性在单位时间内平均每人的生育数记作b(r,t),设育龄区间为

[r1,r2],则

f(t)=∫b(r,t)k(r,t)p(r,t)dr

r2r1

再将b(r,t)定义为

?(r,t)=?(r)

其中h(r,t)满足

r1

r2

h(r,t)dr=1

r2

于是

β(t)=∫b(r,t)dr

r1

f(t)=β(t)∫b(r,t)k(r,t)p(r,t)dr

r1

r2

β(t)的直接含义就是时刻t单位时间内平均每个女性的生育数。如果所有女性在她的育龄期所及的时刻都保持这个生育数,那么β(t)也表示平均每个女性一声的总和生育率。

模型中死亡率?(r,t)、性别比函数k(r,t)和出示密度函数p0(r)可以由人口统计资料直接获得,或在资料的基础上估计,而生育率β(t)和生育模式h(r,t)则是可以用于控制人口发展过程的两种手段。β(t)可以控制生育的多少,h(r,t)可以控制生育的早晚和疏密。我国的计划生育政策正是通过这两种手段实施的。

从控制论观点看,在模型的限制条件中,p(r,t)可视为状态变量,

p(0,t)=f(t)可视为控制变量,是分布参数系统的边界控制函数。控制输入中含

有状态变量,形成状态反馈,β(t)视为反馈增益,并且通常是一种正反馈。

4.3模型求解求死亡率

如图,?(r,t)与时间的关系不明显,故假设?(r,t)=

?(r)。

图4.31

(r,t)实际上,可将?看作一个随机过程t取2001~2005五组数据时,可分别得到?关于r的五条图线,如图,r取某值时的粉色线与该过程的图像取得了五个交点,其对应的?值作为一组向量,称为“年龄随机向量”。

图4.32

2005

令r取一定值,?ij表示ri时t取j时交点对应的?值,则?=

j=2001

?ij。再将

其对r进行拟合,得到“总体死亡率”--*?(r)。以城市男性总体死亡率为例。

图4.33

拟合得到:

?

*?(r)=0.0837?e0.0970(r-9.9703)

带入误差公式,计算误差:

1n*?(ri)?*?iWucha=∑,其中*?i表示r取t≥r时对应的死亡率,得误差为:

ni=1*?i

1.8‰

求总体死亡率

图4.34

拟合得到:

?

?(r)=0.0723?e0.0998(r-9.9838)

误差为:3.3‰求边界条件

求初始密度函数p0(r)=p(r,0),即令t取0,求得人口与年龄间的关系。以城市女性人口数为例。

图4.35

图由橙色线化为两部分:右边部分为老年人群,在老年人群中,人数的波动变化不大,曲线比较光滑,可以采用高阶方程拟合;左边部分为非老年人群,整体上满足一个开口向下的抛物线,但波动比较剧烈,可以在高阶方程的基础上,叠加波动项的方法拟合。

图4.36

得到函数:

54436289

p(0r)=(1.17r?441.14r+6.76?10r?5.22?10r+2.01?10r?3.09?10)

+(-300r2+19760r?169390)*sin(误差为:0.51573‰求初始人口密度:

2πr)5

图4.37

拟合得到:

图4.38

函数为:

54536267

p(0r)=(247.30r?11996r+1.94?10r?1.21?10r+3.23?10r?1.12?10)

误差为:0.11972‰

求单位时间生育率f(t),由f(t)=p(0,t)知f(t

)为每年的新生婴儿数量

图4.39

可用高阶方程拟合:

图4.310

函数为:

f(t)=(247.30r5?11996r4+1.94?105r3?1.21?106r2+3.23?106r?1.12?107)误差为0.78078‰

将边界条件带入人口密度函数,求一阶偏微分方程。

?(247.30(r-t)5?11996(r-t)4+1.941?05(r-t)3?1.211?06(r-t)2+3.231?06(r-t)+1.121?07?

0≤t≤r?+(-4800(r-t)2+414600(r-t)?7642500)?sin2π(r-t)))*e?0.724e(0.0998r?0.996)(1?0.0998t)

?7?pr(,t)=?

?54536267(247.30(t-r)?11996(t-r)+1.94?10(t-r)?1.211?0(t-r)+3.231?0(t-r)+1.121?0)t≥r?

?*e-(0.724e(0.0998r-0.996)-0.267)??

将t、r的值带入方程式中即可求得对应t时刻不同年龄r的人数,现对2006~2009年人口数预测如下:年份2006200720082009预测值(亿)13.18713.25813.33913.401

5、长期Leslie预测模型

人口预测最常用到Logistic模型,Leslie模型,线性回归模型,有着各自的优缺点。发现用Leslie模型在中长期预测中较好,尤其在人口转折时期[6]。

Leslie人口模型20世纪40年代提出一个预测人口按年龄组变化的离散模型[8]。

5.1模型假设

(1)将时间离散化,鉴于男女人口通常有一个确定的比例,模型主要考虑女

性人口,由女性人口可以得知总人口数;

(2)假设女性最大年龄为S岁,将其等间隔划分成m个年龄段,不妨假设

S为m的整数倍,每隔S/m年观察一次,不考虑同一时间间隔内人口数

量的变化;记ni(t)为第i个年龄组t次观察的女性总人数,记

n(t)=[n1(t),n2(t),L,nm(t)]

第i年龄组女性生育率为bi(注:所谓女性生育率指生女率),女性死亡率为

di,记si=1?di,假设bi,di不随时间变化;

(3)不考虑生存空间等自然资源的制约,不考虑意外灾难等因素对人口变化的影响;

(4)生育率仅与年龄段有关,存活率也仅与年龄段有关。5.2模型建立

根据以上假设,可得到方程

n1(t+1)=∑bini(t)

i=1

m

ni+1(t+1)=sini(t)

写成矩阵形式为

i=1,2.…,m-1

n(t+1)=Ln(t)

?b1b2Lbm?1bm???s0L00?1??其中,L=?0s20L0?

?

?MOOOM????0K0sm?10?

(1)

n(0)=[n1(0),n2(0),L,nm(0)]

假设n(0)和矩阵L已经由统计资料给出,则

(2)

n(t)=Ltn(0),t=0,1,2,L

为了讨论女性人口年龄结构的长远变化趋势,我们先给出如下两个条件:(i)si>0,i=1,2,…,m-1;

(ii)bi≥0,i=1,2,…,m,且bi不全为零。

易见,对于人口模型,这两个条件是很容易满足的。在条件(i)、(ii)下,下面的结果是成立的:定理1

L矩阵有唯一的单重的正的特征根λ=λ0,且对应的一个特征向量为

n*=[1,

m?1

s1/λ0,s1s2/λ2]T0,…,s1s2…sm-1/λ0

(3)

定理2

若λ1是矩阵L的任意一个特征根,则必有λ1≤λ0。定理3

若L第一行中至少有两个顺次的bi,bi+1>0,则

(i)若λ1是矩阵L的任意一个特征根,则必有λ1

t?>+∞

(4)

其中c是与n(0)有关的常数。

定理1至定理3的证明这里省去。由定理3的结论知道,当t充分大时,有

n(t

)≈cλt0n*

(5)

定理4

记βi=bis1s2Lsi?1,q(λ)=β1/λ+β2/λ2+…+βm/λm,则λ是L的非零特征根的充分必要条件为

q(λ)=1(6)

所以当时间充分大时,女性人口的年龄结构向量趋于稳定状态,即年龄结构趋于稳定形态,而各个年龄组的人口数近似地按λ-1的比例增长。由(5)式可得到如下结论:

(i)当λ>1时,人口数最终是递增的;(ii)当λ

b1+b2s1+b3s1s2+…+bms1s2…sm-1=1

R=b1+b2s1+b3s1s2+…+bms1s2…sm-1

(7)

R称为净增长率,它的实际含义是每个妇女一生中所生女孩的平均数。当R>1时,人口递增;当R

我们用10年对女性人口进行分组。S=90,则i=0,10,20,…,90,编号为1-8的年龄类所对应的年龄区分别(0,10],(10,20],…,(80,90]。2、3、4、5组有生育能力。

n(t+1)=Ln(t)

?0b2L00??s0L00??1?

其中,L=?0s20L0?

??MOOOM???0K0s0?

8??

通过matlab编程实现求解得到城市人口的预测(单位:万人)

年份

城市人口增长率年份200129537.2-----2002365300.2367462003368690.009282004372070.0091682005375260.0085742006378220.0078882007380940.0071922008383520.0067732009385870.0061272010388150.0059092011390250.005412012392190.0049712013393990.004592014395980.0050512015398550.006492016402260.0093092017406690.011013

41189

0.012786

城市人口增长率年份

2019418310.0155872020424550.0149172021431080.0153812022437350.0145452023442990.0128962024447630.0104742025451500.0086462026454360.0063342027456480.0046662028457530.00232029458390.001882030459090.0015272031459650.001222032460140.0010662033460190.000109203446003-0.00035203545985-0.000392036

45939

-0.001

城市人口增长率

203745895-0.00096203845850-0.00098203945795-0.0012204045758-0.00081204145739-0.000422042457460.0001532043457780.00072044458310.0011582045459210.0019642046460100.0019382047461350.0027172048462780.00312049464250.0031762050465630.0029732051467040.0030282052468050.002163

图5.31:城市人口增长率曲线

图5.32:城市总人口预测曲线

6、模型评价

6.1离散中国人口发展模型的评价优点:

1.将宋健人口发展模型中p(0,t+1)=s(0,t)b(t)+g(0,t)项,结合实际情况修正为

p(0,t+1)=s(0,t+1)b(t+1)+g(0,t+1)。并在最后我们用两个模型预测的2002—2005年出生人数与实际进行比较,验证了改进后的模型的准确性。

2.对性别比引进了时间参数t,然后用灰色预测模型对出生的性别比δ(f,t)和δ(m,t)

进行预测。对存活率也作同样的处理,使模型更精确的同时也突显了时间趋势。3.结合多种方法的特点,对前人的方法进行灵活组合运用和改进。缺点:

最后得到的预测人口数目偏大,与我国的战略目标有一定的差值6.2连续中国人口发展模型的评价优点:

1.此方程建立在控制论基础上,对实际情况有较为周全的考虑,而且对于人口的实际

控制有着很强的理论指导价值。

2.精度较高,误差基本都在1‰以内,适合短期预测。缺点

回归方法拟合参数不能找出数据本质上的关联,且此方法过于依赖数据,不能进行长期预测。

6.3长期Leslie预测模型的评价

Leslie模型有较高的精度,对中长期预测较好,能很好的处理人口转折时期的变化,适合长期预测。改进的Leslie模型能在leslie的基础上,进一步提高预测精度。但对于长期预测,所有模型都很难克服数据的缺失带来的误差,以及长期的发展还与诸多非自然因素有关,这样就很难其的预测准确度。

7、模型改进

7.1长期Leslie预测模型的改进

Logistic模型预测的误差较大,原因在于时间较长,人口数据变化大,必然a,b值变化大,因此误差较大且不稳定。线性回归模型在短期内精度最好,但对中长期外推预测,由于置信区间在扩大,误差较大,尤其在转折时期,函数形式发生变化,误差更大。

Leslie模型预测的精度介于二者之间,线性回归模型在短期预测较好,我们如果将Leslie模型与线性回归模型相结合进行人口预测,要比单独使用更好[6],于是我们提出与线性回归结合的Leslie模型。

首先运用Leslie模型的到人口的发展趋势,由此按曲线的变化将其分段,然后再用线性回归拟合得到更精确的估算。

参考文献

[1]姜启源谢金星叶俊,数学模型,北京:高等教育出版社,2003。

[2]马宾,中国人口控制:实践与对策,北京:中国国际广播出版社,1990。[3]李永胜,人口预测中的模型选择与参数认定,财经科学,2004年2期:68-72,2004。

[4]迟灵芝,灰色组合模型在人口预测中的应用,本溪冶金高等专科学校学报,第4卷第2期:38-39,2002。

[5]宋健于景元,人口控制论,软件学研究,1989年1期:1-7,1989。

[6]李华中,人口预测的一种综合分析方法,江苏石油化工学院学报,第11卷第2期:52-55,1999。

[7]曾大洪,考虑年龄结构的女性模型,韶关大学学报,第19卷第3期:72-79,1998。

[8]Lislie人口模型,http://jwc.seu.edu.cn/jpkc/declare/2006smsy/,2007-9

附录一

%灰色预测matlab程序clearallx0=[]

forn=5:1:10fori=1:1:n

x1(i)=0;end

fork=1:1:n

fori=1:1:k

x1(k)=x1(k)+x0(i);endend

fork=2:1:n

z1(k)=0.9*x1(k)+0.1*x1(k-1);endc=0;d=0;e=0;f=0;

fork=2:1:n

c=c+z1(k);d=d+x0(k);

e=e+z1(k)*x0(k);f=f+z1(k)*z1(k);end

a=(c*d-(n-1)*e)/((n-1)*f-c*c);b=(d*f-c*e)/((n-1)*f-c*c);fork=n:1:10

x1(k+1)=(x0(1)-(b/a))*(exp(-a*k))+b/a;x0(k+1)=x1(k+1)-x1(k);http://http://www.unjs.com/news/55B702B265B0F3F0.htmlendendx0

%残差检验clearallx0=[]a1=x0(5);n=4;

fori=1:1:n

x1(i)=0;end

fork=1:1:nfori=1:1:k

x1(k)=x1(k)+x0(i);endend

fork=2:1:n

z1(k)=0.9*x1(k)+0.1*x1(k-1);endc=0;d=0;e=0;f=0;

fork=2:1:n

c=c+z1(k);d=d+x0(k);

e=e+z1(k)*x0(k);

f=f+z1(k)*z1(k);

end

a=(c*d-(n-1)*e)/((n-1)*f-c*c);b=(d*f-c*e)/((n-1)*f-c*c);fork=n:1:n

x1(k+1)=(x0(1)-(b/a))*(exp(-a*k))+b/a;x0(k+1)=x1(k+1)-x1(k);end

a2=x0(5);

a=abs((a1-a2)/a1

%死亡率的拟合x=0:90;y";

fun=inline("c(3)/(sqrt(2*3.14)*c(1))*exp(-(x-c(2)).^2/(2*c(1)))","c","x");c=lsqcurvefit(fun,[1,36,1e+10],x,y")

norm(feval(fun,c,x)-y")^2%检验误差

y1=c(3)/(sqrt(2*3.14)*c(1))*exp(-(x-c(2)).^2/(2*c(1)));plot(x,y,":b*",x,y1,"b")title("乡女总体死亡率")

%%

fun=inline("c(1)*exp(c(2)*(x+c(3)))","c","x");x=0:90;y;

c=lsqcurvefit(fun,[0,0,0],x,y")

norm(feval(fun,c,x)-y")^2;%检验误差y1=c(1)*exp(c(2)*(x+c(3)));plot(x,y,":b*",x,y1,"k")

title("城市男性总体死亡率")%误差检验[m,n]=size(x);b=y1-y";c=y";fori=1:n

a1(:,i)=b(:,i)/c(:,i)/100;end

w=sum(a1)/n

%%分段拟合x=65:91;y";

p=polyfit(x,y",5)

y1=polyval(p,x);%将x1及p带入二次方程plot(x,y,":b*",x,y1,"k")holdon;

%误差检验[m,n]=size(x);b=y1-y";c=y";fori=1:n

a(:,i)=b(:,i)/c(:,i)/100;end

w=sum(a)/n

x1=1:64;

p1=polyfit(x1,q",5)y2=polyval(p1,x1);q1=y2-q";

fun=inline("(d(1).*x1.^2+d(2).*x1+d(3)).*sin(2*3.14/5.*x1)","d","x1");d=lsqcurvefit(fun,[42,-2609,45508],x1,q1)

y3=y2+(d(1).*x1.^2+d(2).*x1+d(3)).*sin(2*3.14/7.*x1);plot(x1,q",":b*",x1,y3,"k")%误差检验[m,n]=size(x1);b1=y3-q";c1=q";fori=1:n

a1(:,i)=b1(:,i)/c1(:,i)/100;end

w=sum(a1)/nholdoff;

title("市区女性人数")p2=p1+p;p2(1)p2(2)p2(3)p2(4)p2(5)p2(6)

%初始人口密度函数x=65:91;%duiyingweiyy";

p=polyfit(x,y",5);

y1=polyval(p,x);%将x1及p带入二次方程plot(x,y1,"k")holdon;%误差检验[m,n]=size(x);b=y1-y";c=y";fori=1:n

end

w=sum(a)/n

x1=21:64;%duiyingweiqp1=polyfit(x1,q",5);y2=polyval(p1,x1);q1=y2-q";

fun=inline("(d(1).*x1.^2+d(2).*x1+d(3)).*sin(2*3.14/7.*x1)","d","x1");d=lsqcurvefit(fun,[-200,26090000,4550800],x1,q1)

y3=y2+(d(1).*x1.^2+d(2).*x1+d(3)).*sin(2*3.14/7.*x1);plot(x1,y3,"k")holdon;%误差检验[m,n]=size(x1);b1=y3-q";c1=q";fori=1:n

a1(:,i)=b1(:,i)/c1(:,i)/100;end

w=sum(a1)/n

x2=1:20;%duiyingweiq2q2";

p2=polyfit(x2,q2",5);

y4=polyval(p2,x2);%将x1及p带入二次方程plot(x2,y4,"k")holdon;

plot([x2x1x],[q2"q"y"],":b*")holdoff;

title("初始人口密度")p3=p1+p+p2;p2(1)p2(2)p2(3)p2(4)p2(5)p2(6)

%生育率

x=1:21;%duiyingweiq2y";

p=polyfit(x,y",5);

y1=polyval(p,x);%将x1及p带入二次方程plot(x,y,":b*",x,y1,"k")%误差检验[m,n]=size(x);b=y1-y";c=y";fori=1:n

end

w=sum(a1)/np2(1)p2(2)p2(3)p2(4)p2(5)p2(6)

附录二

表3.81城市男性人口预测表

200220030

1234567891011121314151617181920212223242526272829303132

1473211.3

1379460.7

200413381161310421134485314793381445572164744516138231681066181555118155511950037184815819164152353492252159925213442621880251991322856132084522218538625542742251042218440423833472521599238474526879962586177282047332600433294291

2005

1537152.3

2006

1585000.8

2007

1558144.1

2008

1545704.8

2009

1538477.2

2010

1501508.1

1561200.6

144301913570951292814148249815133841569783163692515751541697915175963918835372161977222203522537542375986213109119755772006907237779427159022217143213077221893752192862212932223778652469076271685430883223118020345380134591631463420131123114793381411036158007616798391712938181555118137721882323194941319836582418823251905224879782585994245325222494752353351245435629242362418581221603423534922454356245256525888422755542299089132909363558764355844315708891174017140979314433591611047147692617454581745458181259118125911946857187870919468572013990248392025507982651170271720024497172013990187972420130432515901228154020773562316088241441922472462716221261446929861933322485

1656464166570014850321629946177546918478821739079191981019202142028621217408821015972210013224667023548382716169286229128982043187705278927024991752499576264389631154442752467264471728620332860630275224730419273150724340426515757501655650166465414845221629821177406518471181738795191918319197752028089217380521007312209072224601723535082715459286097428975933186999278729324980572497591264343831139102751867264346628600232859354274974330384643147779154876215751451655268166404214843721629209177314818467781738199191882219192322027750217310720997772208726224442223528742714008286031728971473185948278601524963722497041264195131132522750718264126628585352856630274666030349301537629154803615746871654746166388714838841628459177274018464181737861191829519188252027296217247220993622207381224388223517632713247285978328960503184844278458824957132495256264151931118722748358263976228560572853950274350215296611536758154748615741751654560166330114832971628057177230818460121737462191780619182802026731217202020980712206733224254823509242712648285866328949453183164278379624936232494739264008431097302746553263700828535132851419

343536373839404142434445464748495051525354555657585960616263646566676869707172737475767778339137925888463024134320315035774384256386280694420343992641959231084430239522953641271307627423122652796237042222110501969114192355818125611533397147342513819761199736122917611077601107371115194412197871100210118847311875461182005109556310262131064028934487.2901470.2856230.5718411.3718396.4559851.9530836.3436368.7338813.935638603896095285478333536933560938382666046046013357190217907028863452515295308450131518712820858298789929181522475961238358120407082108866191120316408551635418153423912976081234771116479013309201227556132466711647321259046129040912542551151093115882411119751048684907986.8860190713455.2743634.7650807.9504249.9479840.1375857134584473728336272231231258363325832365595946349493220815214793528900942477717301669731486772850562291879827860282540835244499221709862138499207057816679151701038146846813576971268440126881613371951402814135694011915431359909129901112887641210379118438112136541010805914723.7885412692986.4721375.3580139.8478359.5348389837548983487285375843227850723186138341501736539554289680308428819119512574359227330029421253013734267906327479112939466247455625030872168557223501120008381731808170102115568481333489136743213014351299812128755912902681089129122973912194931107651108170811109261009105913188.5816798.6792479.7653036.1579152.9477537.1

37650263909835416354237645744017959304025234736353725950376351946290543290243191571925661092275737285424630681592706574288704128521562490423245149621265842090225201857516921341654931150904514011991291484121702412161121253390121281010681911173085113667810977311059461953103.5985349.2806226.5730541.2728600.5554654.5553494.8361719137606223906149415772437601744014073303478134670213718664375782146243433281267190816225586632269288284510130575532697688287587628409262479806244178121151302079343200769216811331644591149615813871831274991120105911987191230754119390510452091150498111007010660261026120922041.3959579.9775417.9703837.9701121.1528420.5339658436130123756726390095441534983756670400823230276523461116371294037527324615844327316619005242551594225986428349133048400268873428643362830360246996224296092103030206753219953141669626163346714824641369724125904411835831176061121133111711041021497112316010770431033907993412.8895688.6928003.7748394.1676245676002.4313941433923643608942375217938964674150527374996540006663021828345526437080923744264460782932646671892920254166622500422824636303969326767412852698281986524577612417557209158120545211983896165906416203201465551135299012417861160559115742411891001146235994920.9108896710451811004175967032.3863728.3899898.7722020.8650998.53026278313509833884653604723374840238930554144064374336439943813015641345052336998383736280459927432572291883499253232922390492814816302781526649412841568280771524458362406313207771420434161972781164672016052551448296133578912205311142912113475211635361119783963513.510581291015265978537.4932721.5837209.7873559.5696235.7

8081828384858687888990292203.5278573.8199909.3144687.2106508.9107116.781318.7478452.8853943.1724862.4227529.07304612.5316490.9247208.2174159.8160010.610729587800.0653486.1461479.2760704.6431273.88378250.8339409.9285395.1219113.1146776.4125743.278428.1293933.8252611.6850715.1728894.82310459.8305240.3251335.2218729.3180068.8125523.9111830.193769.3452502.0250605.5228839.99375604.3338142.4268200.2234046.1196890.4161511.2129232.293916.8463685.4259836.5928563.23417690349455.2316496.5249364.7217706178041.3145943.2117012.585312.1952305.6154665.45501843.1392367.1326737.8295841.7233163.1198372.1161627.2134120.2108252.472861.0146771.5476917.6475400.1369458.7307465.7278019215400.5181287.9150190.9124760.894618.5866689.57624913.1450395.6454160.3350530.4289015.3261142.4197953.4169844.6140160.4111433.188762.33

说明:对于篇幅的考虑,在这里我们只给出城市男性的预测完整表

本文来源:http://www.longjiam.com/chuzhongzuowen/44874.html