
基于BP神经网络的人口预测方法研究_毕小龙.pdf
3页第 31 卷 第 3 期2007 年 6 月武 汉 理 工 大 学 学 报 (交 通 科 学与 工 程 版 )Jou rnal of W uhan U n iversity of T echno logy(T ran spo rtation Science & Engineering)V o l. 31 N o. 3June 2007基 于 B P 神 经 网 络 的 人 口 预 测 方 法 研 究 3收 稿 日 期 : 2007202213毕 小 龙 : 男 , 36 岁 , 博 士 , 主 要 研 究 领 域 为 社 会 保 障3 湖 北 省 教 育 厅 教 学 研 究 项 目 资 助 (批 准 号 : 2003084)毕 小 龙 袁 勇(武 汉 理 工 大 学 管 理 学 院 武 汉 430070)摘 要 : 对 人 口 数 量 的 准 确 预 测 可 以 为 制 定 社 会 经 济 可 持 续 发 展 计 划 提 供 重 要 依 据 . 文 中 将 BP 神 经网 络 应 用 于 人 口 预 测 , 采 用 M atlab 的 神 经 网 络 工 具 箱 函 数 建 立 神 经 网 络 预 测 模 型 , 运 用 该 模 型 对2002 年 至 2015 年 全 国 乡 镇 人 口 中 0~ 17 岁 年 龄 段 的 人 口 进 行 了 预 测 . 实 践 证 明 , 该 模 型 编 程 简 单 ,还 能 克 服 常 规 语 言 建 立 预 测 模 型 存 在 的 模 型 复 杂 、 训 练 时 间 长 等 缺 点 .关 键 词 : 神 经 网 络 ; BP 网 络 ; 人 口 预 测中 图 法 分 类 号 : T P l83人 口 预 测 是 一 个 非 常 重 要 的 理 论 和 实 践 问题 . 传 统 的 人 口 预 测 方 法 主 要 有 逻 辑 方 法 、 常 微 分方 程 方 法 和 动 态 预 测 方 法 [1 ]等 . 这 些 方 法 在 人 口预 测 领 域 起 到 了 一 定 的 作 用 , 但 采 用 这 些 方 法 时都 要 对 数 据 进 行 模 型 假 设 . 由 于 真 实 模 型 往 往 是非 线 性 的 , 如 果 在 一 些 简 单 的 模 型 假 设 下 就 进 行数 据 模 拟 , 常 常 不 能 达 到 较 好 的 模 拟 效 果 .神 经 网 络 对 复 杂 非 线 性 系 统 具 有 曲 线 拟 合 能力 , 基 于 BP 神 经 网 络 的 时 间 序 列 预 测 方 法 只 需 以历 史 数 据 作 为 输 入 , 通 过 抑 制 与 激 活 神 经 网 络 节点 , 自 动 决 定 影 响 性 能 的 参 数 及 其 影 响 程 度 , 自 动形 成 模 型 , 无 需 进 行 模 型 假 设 . 文 中 利 用 该 方 法 对我 国 人 口 进 行 了 预 测 .1 基 于 B P 神 经 网 络 的 人 口 预 测在 选 择 BP 神 经 网 络 结 构 后 , 利 用 输 入 输 出 样本 观 测 值 集 对 网 络 进 行 训 练 , 对 网 络 的 权 值 和 阈值 进 行 学 习 和 调 整 , 经 过 神 经 网 络 拟 合 与 预 测 模型 的 校 验 , 使 网 络 实 现 给 定 的 输 入 输 出 映 射 关 系 .BP 神 经 网 络 的 学 习 过 程 由 正 向 传 播 和 反 向 传 播组 成 . 在 正 向 传 播 过 程 中 , 输 入 信 息 从 输 入 层 经 隐含 层 逐 层 处 理 , 传 向 输 出 层 . 每 一 层 神 经 元 的 状 态只 影 响 下 一 层 神 经 元 的 状 态 . 如 果 输 出 层 得 不 到期 望 的 输 出 , 转 入 反 向 传 播 , 将 误 差 信 号 沿 原 连 接通 道 返 回 , 通 过 修 改 各 层 神 经 元 的 权 值 , 直 到 网 络的 输 出 与 期 望 的 输 出 误 差 在 允 许 范 围 内 [2 ].1. 1 神 经 网 络 模 型 结 构 确 定 与 数 据 处 理神 经 网 络 采 用 试 算 法 来 确 定 输 入 节 点 和 隐 含节 点 , 输 入 结 点 数 和 隐 含 节 点 数 采 用 由 小 到 大 的方 法 分 别 进 行 试 算 , 输 出 结 点 数 取 为 1. 通 过 试 算和 仿 真 , 输 入 节 点 取 一 个 , 隐 含 节 点 取 8 个 , 训 练1 500次 以 上 , 网 络 误 差 精 度 能 达 到 0. 1%. 因 此 文中 采 用 具 有 一 个 隐 含 层 的 三 层 BP 神 经 网 络 预 测系 统 进 行 人 口 预 测 , 隐 含 层 具 有 8 个 隐 含 节 点 、 一个 输 入 节 点 和 一 个 输 出 节 点 . 在 神 经 网 络 人 口 预测 系 统 中 采 用 动 量 法 和 自 适 应 调 整 策 略 改 进 BP算 法 . 根 据 人 口 预 测 系 统 的 特 点 和 预 测 要 求 , 可 设BP 神 经 网 络 以 时 间 为 输 入 、 人 口 总 量 或 人 口 比 例为 输 出 . 在 以 时 间 为 输 入 和 以 人 口 总 量 或 人 口 比例 为 输 出 时 , 如 果 直 接 以 年 份 为 输 入 数 据 , 则 对 神经 网 络 来 说 输 入 数 据 太 大 , 同 理 , 神 经 网 络 的 输 出是 人 口 总 量 或 者 人 口 比 例 , 输 出 数 据 也 太 大 , 所 以对 输 入 和 输 出 数 据 即 年 份 人 口 观 测 值 (输 入 )和 人口 总 量 (输 出 ) 等 数 据 要 进 行 预 处 理 和 后 处 理 . 因此 先 将 输 入 数 据 归 一 化 处 理 , 再 将 输 出 数 据 进 行还 原 处 理 . 将 原 始 数 据 进 行 归 一 化 处 理 , 即 通 过 线性 变 换 将 输 入 和 输 出 数 据 统 一 限 制 在 [ 0, 1 ]区 间内 . 如 输 出 数 据 为 人 口 总 量 , 则 归 一 化 处 理 使 之 在0- 1 的 范 围 . 设 置 完 训 练 参 数 之 后 , 可 以 调 用train 函 数 对 BP 网 络 进 行 训 练 . M A TLAB 工 具 箱提 供 了 BP 神 经 网 络 训 练 前 、 后 数 据 的 预 处 理 和 后处 理 函 数 , 如 表 1 所 列 [3 ].表 1 数 据 预 处 理 和 后 处 理 函 数函 数 名 称 功 能p rem nm x 把 数 据 归 一 化 到 [0, 1 ]之 间po stm nm x 恢 复 被 函 数 p rem nm x 归 一 化 的 数 据po streg 利 用 线 性 回 归 分 析 对 神 经 网 络 的 仿 真结 果 进 行 后 处 理p restd 把 数 据 归 一 化 为 单 位 方 差 和 零 均 值po ststd 恢 复 被 函 数 p restd 归 一 化 的 数 据p repca 对 输 入 数 据 进 行 主 元 分 析tram nm x 利 用 预 先 计 算 的 最 大 和 最 小 值 对 数 据进 行 变 换trastd 利 用 预 先 计 算 的 均 值 和 方 差 对 数 据 进行 变 换trapca 利 用 预 先 计 算 的 主 元 分 析 矩 阵 对 数 据进 行 变 换1. 2 模 型 训 练 和 验 证模 型 确 定 之 后 , 再 对 网 络 进 行 训 练 和 测 试 .文 中 对 神 经 网 络 的 训 练 和 验 证 用 M atlab 完成 的 . 训 练 误 差 指 标 初 始 设 定 为 1× 10- 12, 学 习 速率 A初 始 设 定 为 0. 01% , 最 大 训 练 次 数 (最 大 步长 )设 为 2 000. 隐 含 层 中 的 神 经 元 采 用 双 曲 正 切 S型 传 递 函 数 , 双 曲 正 切 S 型 传 递 函 数 用 于 将 神 经元 的 输 入 范 围 从 (- ∞ , + ∞ ) 映 射 到 (- 1, + 1) ,又 因 为 正 切 函 数 是 可 微 函 数 , 适 合 于 BP 算 法 训练 的 神 经 元 . 输 出 层 采 用 线 性 传 递 函 数 pu relin, 可得 到 输 入 矢 量 为 X 时 的 网 络 层 输 出 矩 阵 [4 ]. 图 1显 示 了 当 用 8 个 隐 层 神 经 元 时 学 习 中 的 误 差 平 方SSE (sum of squared erro r)的 变 化 情 况 .图 1 训 练 学 习 过 程 中 SSE 变 化 情 况文 中 采 用 的 数 据 来 自 中 国 国 家 统 计 局 1989年 到 2001 年 的 中 国 人 口 统 计 年 鉴 (见 表 2).表 2 全 国 乡 镇 部 分 年 龄 的 人 口 数 据样 本 类 型 年 份 统 计 值 (实际 值 ) 千 人 输 出 值 (预测 值 ) 千 人 相 对 误 差 %训练样本观测值1988 349 681 349 475 0. 5891989 310 078 310 185 0. 3451991 298 862 299 013 0. 5051992 300 951 300 812 0. 4621993 315 089 315 169 0. 2541994 292 758 292 603 0. 5291995 278 490 278 387 0. 3701997 252 929 252 871 0. 2291998 257 611 257 545 0. 2561999 252 322 252 253 0. 273校 验 样 本观 测 值 2001 261 882 261 831 0. 194从 图 1 和 表 2 可 以 看 出 , 在 选 择 期 望 误 差 和 神经 网 络 隐 含 层 的 神 经 元 个 数 后 , 用 训 练 数 据 对 神经 网 络 进 行 训 练 , 训 练 步 数 1 589 次 后 达 到 期 望 误差 , 训 练 停 止 , 训 练 取 得 了 预 期 目 标 . 11 个 样 本 观测 值 的 模 拟 输 出 与 期 望 输 出 的 相 对 误 差 均 在 正 负0. 6% 的 范 围 内 , 模 型 的 收 敛 效 果 较 好 . 经 过 上 述训 练 所 得 到 的 权 重 体 系 及 偏 置 值 所 确 定 的 网 络 就是 所 要 建 立 的 预 测 神 经 网 络 模 型 .2 人 口 预 测 实 例下 面 以 1988~ 2001 年 的 历 史 数 据 作 为 样 本预 测 至 2015 年 我 国 乡 镇 人 口 中 0~ 17 岁 年 龄 段 的人 口 数 . 预 测 结 果 见 表 3.2. 1 BP 神 经 网 络 预 测 模 型 的 训 练 步 骤 [5 ]步 骤 1 给 神 经 网 络 的 连 接 权 值 W jk ,W ij和 神经 元 阈 值 H赋 初 值 . 同 时 , 对 下 面 的 数 据 进 行 初 始化 : 设 定 误 差 最 小 值 ; 设 定 学 习 速 率 ; 设 定 最 大 训练 次 数 .步 骤 2 输 入 样 本 模 式 的 矩 阵 矢 量 X 和 期 望输 出 向 量 Y= [y 1, y 2, … , y n ]T.步 骤 3 根 据 各 输 出 单 元 的 输 出 函 数 计 算 各样 本 模 式 隐 层 和 输 出 层 各 单 元 的 实 际 输 出 值 .步 骤 4 从。












