智能体(Agent):具有自治性、社会性、反应性和预动性的基本特征的实体,也可被看作是相应的软件程序或者是一个实体(比如人、车辆、机器人等)
多智能体系统(Multi-Agent System):多个相互作用的智能体,各个智能体之间通过相互通信、合作、竞争等方式,完成单个智能体不能完成的,大量而又复杂的工作
智能体的三个主要工作组件:
传感器:检测环境变化
执行器:能量转化为运动(e.g. 电机、齿轮)
效应器:影响环境(e.g. 手指、显示屏、轮子)
智能体的任务环境PEAS表示:
性能度量(Performance Measure):智能体行为成功的客观指标
环境(Environment):智能体周围工作环境和条件
执行器(Actuators):智能体产生结果的设备、硬件和软件,将动作的输出传递给环境
传感器(Sensors):智能体观察和感知环境的设备,智能体通过其接收输入
理性智能体(Rational Agent):选择一个预期能最大化其性能度量的动作
全知智能体(Omniscient Agent):明确知道其行为的实际结果,“做事正确”
理性全知
智能体的环境类型(Types of Environments):
(1) 完全可观察 vs 部分可观察(e.g. 国际象棋 vs 自动驾驶)
(2) 确定性环境 vs 随机性环境(即当前状态是否唯一地确定下一状态,e.g. 国际象棋 vs 自动驾驶)
(3) 竞争环境 vs 合作环境(e.g. 国际象棋 vs 自动驾驶,自动驾驶是多辆自动驾驶汽车合作避免相撞)
(4) 单智能体 vs 多智能体(e.g. 一个人在迷宫中 vs 足球队)
(5) 动态环境 vs 静态环境(e.g. 过山车 vs 空房子)
(6) 离散环境 vs 连续环境(即一个环境是否由有限数量的操作组成,e.g. 国际象棋 vs 自动驾驶)
(7) 片段式 vs 延续式环境(e.g. 问答机器人 vs 网球运动员)
注:(6)是在空间上的连续,(7)是在时间上的连续
智能体的结构:
行为(Behavior):感知后做出的动作
架构(Architecture):某个具备物理传感器和执行器的计算装置
函数(Function):环境信息→行为,整个感知历史→动作
程序(Program):描述智能体行为,必须适合架构,当前感知→动作,是智能体函数的实现
智能体的形式:人类智能体(Human Agent)、机器人智能体(Robotic Agent)、软件智能体(Software Agent)
智能体的特点:情境性(Situatedness)、自主性(Autonomous)、适应性(Adaptivity)、社交性(Sociability)
智能体的类型:
- 简单反射智能体:直接感知信息做出反应
- 基于模型的反射智能体:保持内部状态,依赖感知历史
- 基于目标的智能体:为达到目标而行动
- 基于效用的智能体:试图最大化其期待的“快乐”
- 学习智能体:可以从过去的经验中学习,由学习元件、评判元件、性能元件、问题产生器组成