2D 仿真机器人足球整体性能的优化与实现毕业论文.doc
《2D 仿真机器人足球整体性能的优化与实现毕业论文.doc》由会员分享,可在线阅读,更多相关《2D 仿真机器人足球整体性能的优化与实现毕业论文.doc(34页珍藏版)》请在课桌文档上搜索。
1、本 科 生 毕 业 设 计 论文题目 2D仿真机器人足球整体性能的优化与实现目 录摘要11 绪论21.1 背景及意义21.2 RoboCup机器人世界杯21.3 RoboCup仿真比赛31.4 论文组织结构32 RoboCup仿真比赛综述42.1 RoboCup仿真平台简介42.2 比赛服务器端42.3 球员客户端62.4 仿真平台主要特点63 多智能体系统架构73.1 团队整体策略73.1.1 角色和阵型73.1.2 局部通讯模型83.2 智能体体系结构103.2.1 建模103.2.2 通讯123.2.3 动作123.2.4知识库133.2.5 规划决策144异构智能体的选择和辨识154.
2、1在线教练设计164.2异构智能体简介174.3异构智能体的选择174.3.1指标提炼184.3.2 指标归一化194.3.3 分配算法194.4 异构智能体识别204.5小结205智能体间的配合与对抗215.1智能体间的配合传球215.1.1传球路线的搜索215.1.2传球路线的决策225.1.3更多的配合245.2智能体间的对抗射门245.2.1领先一步模型245.2.2射门成功率分析245.2.3射门动作的测试265.2.4其他对抗动作276 系统架构27结论与展望29参考文献30致谢31毕业设计2D仿真机器人足球整体性能的优化与实现摘要:随着计算机技术的告诉发展,分布式人工智能中的多智
3、能体系统(MAS: Multi-agent System)的理论与及应用研究已经成为人工智能研究的热点。RoboCup(Robot World Cup,即机器人足球世界杯)作为人工智能和机器人学新的标准问题,具有多智能体系统的诸多特征,是各种新理论和技术良好的试验平台。本文首先介绍了RoboCup的研究背景,然后介绍了rcssserver的的仿真环境。从第三章开始切入本文正题,首先从团队整体策略和智能体体系结构两方面讲解了多智能体系统架构,其中应用了混合型的智能体体系结构将智能体架构分为建模模块、通讯模块、动作模块、知识库模块、规划决策模块和反应模块。第四章讲解了利用在线教练实现异构智能体的选
4、择和辨识,并给出了智能体的选择和分配的框架。第五章在异构智能体的前提下重新完成了智能体间配合和对抗中典型动作的精炼。整体上对仿真机器人足球系统进行了优化。关键词:RoboCup;分布式人工智能;多智能体系统Optimization and Implementation of the 2D simulation of the overall performance of the robot soccerAbstract:With the development of the computer technology, research on the theory and application o
5、f Multi-agent system (MAS) has become a hotspot of Artificial Intelligence. As a new standard problem of AI and Robotics, RoboCup environment is a typical MAS and it is a good test bed for the theory and technology in this domain. First,this paper introduces the research background of RoboCup.Second
6、, the simulation environment of robot soccer. After presenting the aim of this thesis, first it introduces the architecture of the multi-agent system from two aspects of the teams overall strategy and the agent architecture, it apply the hybird agent architecture in the team. The architecture consis
7、ts of modeling, communication, actions, domain knowledge, deliberative reasoning and reactive module. Accomplished the assignment and recognition of heterogeneous agent by an online coach in chapter four, some essential guidelines are abstracted and the framework of assignment is set up with these g
8、uidelines. Refined the typical actions with heterogeneous agents in chapter five. It optimization the simulation system as a whole.Key words:RoboCup; Distributed Artificial Intelligence; Multi-agent system1 绪论1.1 背景及意义智能体(Agent)和多智能体系统(MAS:Multi-agent System)是当今人工智能领域的研究热点之一,其应用背景包括各类自主机器人、网络信息代理、分布
9、式过程控制和新一代软件工程。Agent的理论和研究技术最早源于分布式人工智能,但从80年代末开始,Agent理论及技术研究从分布式人工智能中拓展出来,并与许多其他领域的知识互相借鉴,在许多不同于人工智能领域得到了广泛的应用。现在对Agent的特性研究中,认为一个Agent最基本的特性应该包含反应性、自主性、面向目标和社会性,然后根据其应用情况可以拥有其它特性:移动性、自适应性、反应性、理性、持续性、自启动和自利等特性。Agent概念的提出为人们提供了一种系统分析、计算和问题求解风范1。多智能体系统的协作求解问题的能力超过单个的Agent是MAS产生的最直接原因,导致MAS研究逐渐兴起的其他原因
10、还包括:与已有系统或软件的互操作;提高系统的效率和鲁棒性等。与单个Agent相比,MAS具有以下特点:每个Agent仅拥有不完全的信息和问题求解能力,不存在全局控制,数据是分布的,计算过程是并行的。基于MAS的模型概念模型代表了一种分析、设计和实现复杂、大型系统的方法途径。如何在多Agent动态环境中实现Agent的灵活性和动作执行性,是当前MAS的研究热点。此时,RoboCup作为人工智能和机器人学新的标准问题被提了出来,其具有MAS的诸多特征,成为各种新理论及技术的良好试验平台。1.2 RoboCup机器人世界杯RoboCup机器人世界杯是国际上一项为促进分布式人工智能、智能机器人技术及相
11、关领域的研究与发展而举行的大型比赛和学术活动。它通过提供一个标准的平台来检验各种智能机器人技术。它的最终梦想是在2050年组建一支能够打败人类足球世界杯冠军的机器人足球队23。机器人足球赛的最初想法由加拿大不列颠哥伦比亚大学的Alan Mackworth教授于1992年正式提出。日本学者立即对这一想法进行了系统的调研和可行性分析。1993年,Minoru Asada、Hiroaki Kitano和Yasuo Kuniyoshi等著名学者创办了RoboCup机器人世界杯(Robot World Cup,简称RoboCup)。与此同时,一些研究人员开始将机器人足球作为研究课题。隶属于日本政府的电子
12、技术实验室(ETL)的Itsuki Noda以机器人足球为背景展开多智能体系统的研究,日本大坂大学的浅田蟋、美国卡耐基-梅隆大学的Veloso等也开展了同类工作。1997年,在国际最权威的人工智能系列学术大会-第15届国际人工智能联合大会(The 15th International Joint Conference on Artificial Intelligence,简称IJCAI -97)上,机器人足球被正式列为人工智能的一项挑战。至此,机器人足球成为人工智能和机器人学新的标准问题。将机器人足球作为未来人工智能和机器人学标准问题是十分恰当的,主要是由于机器人足球具有以下特点:(1)典型性
13、:RoboCup机器人足球队的研制涉及当前人工智能研究的大多数主要热点,因而构成一个典型问题。(2)可行性:多Agent系统多数实际背景十分复杂,以致研究人员在目前条件下难以把握,无法兼顾具体细节分析与探索基本问题。而在机器人足球中则较易兼顾二者,易于深入。(3)客观性:比赛提供了一种实验平台和评价各种理论与技术的客观方法,便于研究者的“观察”和相互交流。(4)综合性:在以往的研究中,各种技术通常被分为开发和考察,综合集成工作一般由面向最终用户的应用部门来完成,这种方式不利于相关技术在更高层次上的衔接和更深层次上的创新,而机器人足球是一个深层次的“综合平台”。因此,开展机器人足球的研究是人工智
14、能从基础理论走向实际应用的一个战略性步骤。1.3 RoboCup仿真比赛RoboCup仿真机器人足球比赛是在RoboCup官方提供的仿真平台上进行的,因此设计者不必考虑硬件实现,而将研究集中在动态不确定环境下的问题求解与多智能体合作456。RoboCup仿真球队决策的难点在于以下几点:(1)问题复杂:RoboCup仿真机器人足球比赛中,如果对于场上的22名球员的位置和速度、球的位置和速度等特征完全描述,无疑状态空间极其巨大。如何合理的描述状态并求解决策问题,是一个十分重要的难点,而且RoboCup仿真平台中的噪声也是必须要考虑的问题。(2)信息不完全:RoboCup仿真球队的球员不能完全了解场
15、上的所有信息,仿真平台限制了球员获取信息的途径,每一个球员都必须依赖自身获得的有限信息进行决策。如何获得更多的有效信息,如何利用有限信息进行合理的决策,是RoboCup球队决策的一个重要问题。(3)决策的实时性:RoboCup仿真环境是一个实时动态环境,环境可能发生不可预期的改变,这将使得原有的决策不再适用。这种情况下,要求Agent能够根据场上情况变化,及时做出反应,决策必须实时高效。(4)多智能体的对抗与合作:RoboCup仿真机器人足球比赛中,存在多个独立决策的球员,他们之间既存在合作(同一球队内)也存在对抗(两支球队之间)。如何使球员间协商、规划以实现合作完成任务并在对抗中取得最大效益
16、,这是RoboCup仿真足球的一个重要研究问题。(5)通讯带宽有限且不可靠:多智能体的合作中,通讯能够起到非常重要的作用。而RoboCup仿真平台对球员间的通讯给与了一定的限制。在有限带宽且不可靠的通讯上,如何保证合作的顺利进行,这也是需要解决的问题。1.4 论文组织结构第1部分,绪论,介绍机器人足球的研究背景及RoboCup。第2部分,RoboCup仿真比赛综述,介绍RoboCup仿真比赛以及RoboCup仿真平台。第3部分,多智能体系统架构,从总体上介绍了仿真机器人足球比赛的相关知识。第4部分,异构智能体的选择和辨识,介绍仿真机器人足球比赛中异构智能体的概念和用法。第5部分,智能体间的配合
17、与对抗,介绍仿真机器人足球系统的决策方法以及实现。第6部分,系统架构,介绍仿真机器人足球系统整体的架构。2 RoboCup仿真比赛综述RoboCup仿真机器人足球比赛是RoboCup比赛中参加人数最多、历史最久的子项目,仅需要几台计算机就可以进行比赛,全部的活动由计算机进行模拟,可以避免机械电路的各种硬件限制,将精力集中于高层的算法研究中,在实时异步有噪声的对抗环境下,研究多智能体间的合作与对抗问题。2.1 RoboCup仿真平台简介RoboCup仿真平台是一套能够不同语言编写的自主球员进行足球比赛的系统。比赛的执行采用的是服务器客户端(server/client)模式,服务器端程序rcsss
18、erver提供了一个虚拟场地并且模拟包括球和球员在内的所有物体的移动,每个客户端程序相当于一个球员的大脑,控制场上该球员的移动。服务器端和客户端之间是通过UDP/IP协议进行信息交互的,也就是说,开发者可以使用任何支持UDP/IP协议程序的语言来设计球队程序。通过UDP/IP协议,客户端程序可以发送指令去控制相应的场上球员,而服务器端按照规则给每个客户端发送它所能获得的信息。每个客户端只允许控制一名球员,所以每队必须同时运行与比赛球员数目相等的客户端程序。客户端之间的通讯必须通过服务器端根据规则来进行转发,任何不经过服务器客户端直接联系的行为都是违反规则的。当一场比赛开始时,双方11个独立球员
19、的程序,连接到服务器端进行比赛,每个队的目标就是将球踢进对方球门的同时阻止球进入自己的球门4。2.2 比赛服务器端比赛服务器端包括两个主要程序:rcssserver和rcssmonitor。rcssserver作为一个服务器程序模拟所有球员、球的移动、球员通讯以及根据比赛规则控制比赛进程。rcssmonitor是一个程序将从rcssserver那里获得的场上比赛信息显示到一个虚拟的足球场地上,由客户端程序控制的队员可以在场上跑动、踢球等。rcssserver主要由球场仿真模块、裁判模块和消息板模块三个部分组成,如图2-1所示。教练球员球员SocketSocketSocket消息板裁判球场仿真显
20、示图2-1 rcssserver结构图球场仿真模块计算球场上对象的运动,检测他们之间的碰撞。球场上的对象包括每队各11名队员、球、球门、标记及标志线等。其中球和球员都具有大小、位置、速度、加速度等属性,球员则还有方向、耐力等属性。球员与球的属性每个周期末更新一次,计算的依据是动力学定律。如果球员与球员或球之间发生重叠,则作碰撞处理。裁判模块依据比赛规则控制比赛的进程。由于仿真比赛环境具有动态、实时、不确定、多主体对抗等特点,比赛不可能按照事先的设计按部就班的进行,还需要在比赛中有一个“智能”裁判。目前这个内嵌的人工裁判只是部分实现,可以检测一些简单的形式,如进球、界外球、越位等。然而,还是有一
21、些很难检测的状态,如双方对峙、谁都不踢球,这就需要一个人为裁判。所有的参赛球队都必须遵守一个“绅士协定”,包括不能利用比赛漏洞等有碍比赛公平的做法。消息板模块负责客户端之间的通讯。每个客户端程序通过UDP的socket来连接server。同样,通过socket,客户端程序可以发送命令来控制球员,也可以接受球员的感知信息。rcssserver采用离散化模式运行,即所有程序运行都是以仿真周期为单位。在每个仿真周(simulatorstep,缺省为100毫秒)结束前,server收集所有球员程序的行为请求,直到每个周期末才统一执行并更新场上信息。在每个周期的开始,server根据各个球员的状态(包括
22、可视范围、获得时间等)发送相应的已更新的场上信息,体现了球员感知信息和行动的异步性。如果一个球员在一个周期内发送了多于一条的独立行为请求,server将只执行第一个。因此,球为了保证执行自己的真实意图,每周期就只能发送一条独立行为请求;另一方面,如果球员在一个周期内没有发送行为请求,他将失去该周期的行动机会,对于这样一个实时对抗的环境无疑是很不利的。在rcssserver平台上比赛时,所有仿真比赛场景都可以通过一个可视化程序rcssmonitor显示在电脑屏幕上。它通过一个特殊的端口(缺省为6000)直接和服务器端连接,获得比一般球员程序更全面、更准确的信息,使得用户可以生动地看到比赛的整个过
23、程,并且可以控制比赛的进程。另外,球场和球场上的对象都是二维的,任何对象都没有高度的概念。球用一个实心原点表示。场上每个队员用一个圆圈表示,从圆心处引出两条线段,红色线段代表球员脖子的朝向,黑色线段代表球员身体的朝向。当球员体力低于2400时圆圈一周会变成红色代表此球员体力不支。如图2-2所示。图2-2 球场界面2.3 球员客户端一个球员客户端程序通过UDP接口连接到服务器端。通过这个接口,客户端程序可以发送命令来控制场上的一个球员行动以及接收到这名球员的感知信息。换句话说,一个球员客户端就是球员的大脑:从服务器端接收到感知信息,并且发送命令到服务器端5。如果球员程序都是独立的进程,通过一个特
24、定的端口和服务器端连接。当一个球员程序和服务器端建立好连接以后,所有通讯信息都通过这个端口传输。一个球队最多可以连接12名队员,其中包括11名队员(其中一个是守门员)和1名场上教练。这些球员程序向服务器端发送请求执行相应行为(如踢球、转身、跑步等),服务器端分析处理这些请求,相应的更新场上比赛状态。另一方面,服务器端给所有队员提供他们可以感知到的信息,如球员可以看到的视觉信息、球员自身的状态信息等。由于服务器端实际上是一种以离散时间片(或称为周期)为时间单位工作的实时系统,球员程序必须在每个指定仿真周期内及时做出决策并及时将请求发送给服务器端,否则将错过执行动作的机会。这就要求球员决策要有比较
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 2D 仿真机器人足球整体性能的优化与实现毕业论文 仿真 机器人 足球 整体 性能 优化 实现 毕业论文
链接地址:https://www.desk33.com/p-1266349.html