
时间临界决策控制多智能体系统影响图模型硕士论文.doc
3页动态决策建模理论的研究及应用动态决策建模理论的研究及应用【摘要】 决策问题的建模及求解是当前人工智能领域研究的热点,已成为机器人技术、专家系统等领域的核心技术支持决策分析的目的就是为复杂的具有不确定因素的决策问题提供一种合理的、智能的推理过程,辅助不确定环境中决策者实现理性行为选择其中,概率图模型理论是决策分析领域的主要分支,它利用清晰的图形表达方式,能快速对复杂决策问题建模并求解概率图决策建模技术为决策分析提供了有效的建模工具,促进了决策建模技术的发展本文针对具有时间限制的交互式决策问题,提出一套新的概率图模型理论:基于知识库的时间临界的交互式动态影响图(I-TCDID)建模理论I-TCDID 结合 I-DID 和 TCDID建模理论,在 I-DID 模型中引入了模型抽象和时间抽象的概念同时,I-TCDID 建模技术以知识库模型构建技术和 Meta-Resoning 模型选择技术为基础,实现决策质量和计算复杂性的最佳平衡本文针对 I-TCDID模型,介绍了 TCDID 模型的机器学习算法,这些算法可根据不同决策质量和时间需求,对模型进行不同程度的求解算法在已有的模型求解算法的基础上,引入时间因素,对单时间片内变量间以及不同时间片的变量之间的时间关系进行计算... 更多还原【Abstract】 Decision modeling and solving is currently a research hotspot of the artificial intelligence field, and has become one of the core technical support of robotics and expert systems. The purpose of decision analysis is to provide a reasonable, intelligent reasoning process for complex decision-making problems with uncertain factors, assiting decision makers to select rational behavior in an uncertain environment. In particular, the probabilistic graphical model theory is the main branch of the fie... 更多还原 【关键词】 时间临界; 决策控制; 多智能体系统; 影响图模型; 【Key words】 Time-Critical; Decision Making; Multi-Agent System; Influence Diagram; 摘要 4-5 ABSTRACT 5 第一章 绪论 8-15 1.1 研究背景 8-9 1.2 研究意义 9-10 1.3 国内外研究现状和发展态势 10-13 1.4 作者主要工作 13 1.5 论文结构 13-15 第二章 相关技术基础 15-40 2.1 马尔可夫决策过程 15-24 2.1.1 一般马尔可夫决策过程 15-19 2.1.2 部分可观测马尔可夫决策过程 19-23 2.1.3 交互式部分可观测马尔可夫决策过程 23-24 2.2 贝叶斯网络 24-25 2.2.1 贝叶斯网络 24-25 2.3 影响图 25-31 2.3.1 一般影响图 25-26 2.3.2 交互式影响图 26-28 2.3.3 交互式动态影响图 28-29 2.3.4 时间临界的动态影响图 29-31 2.4 基本算法介绍 31-39 2.4.1 动态规划基本理论 32-33 2.4.2 值迭代精确算法 33-35 2.4.3 模型 ε 精简近似算法 35-36 2.4.4 启发式近似算法(MLS) 36-38 2.4.5 任意时间近似算法 38-39 2.5 本章小结 39-40 第三章 I-TCDID 建模技术 40-63 3.1 I-TCDID 概述 40-46 3.2 TC-OODID 基本定义及框架 46-52 3.3 I-TCDID 模型 52-55 3.3.1 智能体类和模型节点 53-54 3.3.2 紧凑型模型与展开型模型 54-55 3.3.3 基本属性 55 3.4 模型抽象 55-62 3.4.1 TCDID 的模型抽象 56-59 3.4.2 面向对象的模型抽象 59-62 3.5 本章小结 62-63 第四章 I-TCDID 理论在空中导弹防御系统中的应用 63-84 4.1 概述 63-64 4.2 空中防御问题描述 64-67 4.2.1 属性分析 65-66 4.2.2 策略的制定和执行 66-67 4.3 模型的创建 67-81 4.3.1 导弹类 67-69 4.3.2 时间片类 69-74 4.3.3 防御场景类 74 4.3.4 空中防御系统的智能体类 74-76 4.3.5 空中防御决策控制模型的创建 76-81 4.4 实验结果 81-83 4.5 本章小结 83-84 第五章 总结与展望 84-86 5.1 已完成的工作 84-85 5.2 下一步的工作 85-86 致谢 86-87 参考文献【【索购全文索购全文】】Q 联系 Q:138113721 1030850491 全文提供服务费:25 元 RMB 即付即发支付宝账号:xinhua59168@【【说明说明】】1、本站为中国学术文献总库合作代理商,作者如对著作权益有异议请与总库或学校联系;2、为方便读者学习和引用,我们可将图片格式成 WORD 文档,费用加倍。
