徐义文,张 力,慕晓冬,殷小静
(第二炮兵工程学院 四系,陕西 西安710025)
部队传统的训练和演习方法不仅需要花费巨额资金,而且要承担人员伤亡的风险,因此,传统军事训练难以对所有的假想情况进行有效模拟[1]。近年来,虚拟人技术的出现为解决上述问题提供了新方法、新途径,为进一步增强军事训练仿真的实效性开辟了新的道路。
虚拟士兵是士兵在虚拟战场中的三维几何特性与行为特性的表示,是军事仿真的重要组成部分。虚拟士兵是虚拟人技术的一种典型应用,良好的虚拟士兵模型可以大大增强系统的逼真性和沉浸感,甚至达到事半功倍的效果。如何在实时虚拟环境中创建具有真实感的智能行为与运动能力的自主虚拟人已成为计算机、虚拟现实及相关技术学科领域中一项富有挑战性的研究工作[2]。鉴于军事仿真领域的特殊性,虚拟士兵模型的真实度和可信度比其他类型的虚拟人要求更高,只有这样才能达到令人满意的效果。
目前针对虚拟士兵的研究可以归结为两方面:几何建模和行为控制。对于前者,文献 [3]和文献 [4-5]分别运用MDL模型和骨骼动画技术实现了对虚拟士兵基本动作的仿真。对于后者,文献 [6]研究了虚拟士兵的失能模型,并提出了基于模糊规则的最佳攻击目标选择算法,文献 [7]则针对如何提高虚拟士兵外观的多样化进行了重点研究。
现有的虚拟士兵模型缺少对记忆和遗忘的研究,使得虚拟士兵难以表现出与人类相近的记忆和遗忘行为。如果虚拟士兵在复杂的虚拟战场中不具有记忆能力,其感知获得的信息无法及时保存,其他行为就难以继续;如果不具有遗忘能力,相反,总是 “过目不忘”,其行为的真实性也必然令人怀疑。总之,不具有记忆和遗忘能力的虚拟士兵是不完整的、缺少说服力的。因此,需要为虚拟士兵设计符合人类记忆和遗忘规律的记忆模型。
在虚拟智能体的研究中,一些学者进行了相关研究,并取得了一定的成果。文献 [8]将记忆模型引入到人工鱼的建模中,丰富了人工鱼的认知行为;文献 [9-10]在自主虚拟人的感知模型时构建了基于环形队列的记忆模型;文献 [11]构建了虚拟自主汽车的真假记忆库模型;文献[12]则提出了基于链表的记忆模型。
上述记忆模型侧重于在虚拟智能体内部实现单纯的信息存储和删除功能,是对记忆和遗忘的简单模拟。存在的主要问题是模型的结构不够完善,缺少对记忆信息之间的关联关系和存储结构的研究,也没有对记忆信息的遗忘和调用过程进行探讨。为此,本文从生物的记忆和遗忘原理出发,在扩展记忆系统模型的基础上,提出了一个较为完整的智能记忆模型设计方案。
记忆的基本模型包括瞬时记忆、短时记忆、长时记忆3种类型[13],如图1所示。其中,瞬时记忆是感知信息的短时存储,在整个认知过程中起到滤波器的作用;短时记忆由当前头脑中的信息组成,长时记忆则存储着主体关于世界的一切经验和知识。
图1 基本记忆模型
R.Atkinson[14]等在基本模型的基础上进行了扩展,加入了对记忆过程进行控制的记忆控制器,如图2所示。
图2 记忆系统扩展模型
与记忆的保持相对应的是,大脑具有天生的 “遗忘”机制。德国心理学家艾宾浩斯经过长期研究发现了人类遗忘的一般特性:
(1)遗忘在学习之后立即开始,并且每次学习所用去的时间与记忆衰减的时间间隔相比要小得多,为此,在学习期间自然衰减的作用可忽略不计;
(2)遗忘的进程不是均匀的,而是保持 “先快后慢”的原则;
(3)不同个体和记忆材料的遗忘曲线不同。
由于生物记忆与计算机系统的存储形式相似,各种记忆形式能在计算机上获得良好的实现,这就使得记忆原理在计算机系统中的应用成为可能[15]。从信息加工的角度看,记忆包括3个基本过程:信息进入记忆系统-编码,信息在记忆中存储-保持,信息从记忆中提取出来-提取。
为了便于实现对记忆信息的编码,首先需要对记忆信息进行合理的分类。依据虚拟士兵记忆内容的不同,本文将记忆信息分为五大类:实体信息、环景信息、路径信息、任务信息、规则知识。
定义1 记忆强度M(memory degree)是描述虚拟士兵对信息的记忆程度的量,表示当前能调用的记忆信息占完整信息的比重,M∈ [0,1]。由于瞬时记忆和短时记忆存储时间都很短,在其作用期间,可以认为它们的记忆强度保持不变,即假定两种记忆在有效期内有M=1。
定义2 记忆信息元MIC(memory info cell)是记忆系统中最小、最基本的信息单位,是各类记忆信息共有属性的集合,其编码形式为
MIC=<ID,Tc,S,Q,Content,M,tag,Rc,n>式中:ID——MIC的存储编号;Tc——创建时间,S={Entity,Scene,Path,Mission,Rule}——记忆信息的类型;Q= {instant,short,long}——MIC的存储时间类型;Content——MIC包含的具体内容,是MIC最重要的部分,不同的信息类型决定了Content的内部结构;M——MIC的记忆强度;tag——标志位,在不同的记忆存储类型中,该标志位具有不同的含义:对瞬时记忆 (Q=instant),tag为关注标志位;对短时记忆 (Q=short),tag为激活标志位;对长时记忆 (Q=long),tag则为调用标志位;Rc——MIC的记忆最大存储容量,Content包含的信息量不能超过该值,否则超出的部分会进入一个新建的MIC单元;n——MIC的激活或调用次数。
定义3 记忆信息包 (memory info package,MIP)是由若干个相同类型的MIC组成的集合,其编码形式为
式中:ID——MIP的存储编号,Tp——MIP的创建时间,Rp——MIP的最大存储容量,MICSet= {MIC1,MIC2,…,MICh}(Rp≥h≥0)为包含的MIC的集合。
定义4 记忆信息库 (memory info database,MID)是由若干个相互关联的MIP组成的集合,其编码形式为
式中:ID——MID的存储编号,Td——MID的创建时间,Rd——MID的最大存储容量,MIPSet= {MIP1,MIP2,…,MIPn}(Rd≥n≥0)——包含的 MIP的集合。
由于瞬时记忆和短时记忆的存储时间非常短,且信息的更新非常频繁,因此对这两种记忆信息采用槽式存储结构,用时间控制器控制信息存入或退出槽道的顺序,便于更新和访问。槽式结构如图3所示。
图3 槽式存储结构
相比之下,长时记忆的存储时间最长。因为长时记忆是记忆系统中记忆能力最强、记忆信息最多、结构最复杂的记忆,且信息之间常常是相互关联的。为此M.R.Quillian[14]等提出了长时记忆的层次网络模型,按照概念的级别建立信息的层次结构。但是这种模型是静态的,难以描述记忆信息的动态变化过程。为此,借鉴层次网络模型思想,本文采用广义树结构存储长时记忆信息,既能构建较为清晰的信息脉络,使信息之间的关联关系层次分明,又便于实现信息的及时扩充更新和其他操作。
存储记忆信息的广义树就是广义记忆树(general memory tree,GMT),用GMT= {r,T1,T2,…,Tw}表示,其中r为根结点,Ti为其中第i棵子树,w≥0为子树的个数。GMT的创建时间用根结点的创建时间来表示。树中每个结点的度是任意的,这样可以使得相互关联的信息尽可能地保存在相近的位置。GMT的结构如图4所示。
图4 GMT结构
若干个GMT集合在一起便是广义记忆森林 (general memory forest,GMF)。用符号可表示为:GMF={GMT1,GMT2,…,GMTm},其中 m≥0为 GMT的个数。GMT在GMF中按照其创建时间的先后进行排列,便于后续对信息的快速搜索。GMF的结构如图5所示。
图5 GMF结构
记忆控制器的作用是建立记忆信息存储时限的转换规则,为模拟遗忘行为提供相应的信息删除算法,并为完成记忆信息的提取和调用提供较为简单、有效的实现算法,是智能记忆模型不可或缺的组成部分。
根据记忆原理可知,瞬时记忆存储时间非常短,遗忘非常快,只有少部分得到持续关注的瞬时记忆元才能转换为短时记忆元;短时记忆元经过多次学习,达到一定阈值时则转换为长期记忆元;长时记忆元若被记忆系统调用,该长时记忆元则被添加到为短时记忆中。给瞬时记忆元添加关注时间变量ta,当其关注标志位tag变为1时,ta开始计时。记Ta为瞬时记忆关注时间阈值,Nk为短时记忆激活次数阈值,则存储类型之间的转换规则为:
对瞬时记忆和短时记忆而言,由于不具有明显的遗忘过程,可以根据其作用的时间来判定是否将其遗忘。对瞬时记忆元,当其关注标志位tag为0时,表明当前未获得关注,则删除该记忆;对短时记忆元而言,当其激活标志位tag为0时,表明当前处于未被激活状态,该信息没有被使用,则删除该记忆。
长时记忆存储时间较长,遗忘过程比较缓慢,只有当其记忆强度低于一定阈值时,才能判定该记忆被遗忘。根据遗忘机理,构建相应的遗忘函数如下
式中:M1、M2——t1、t2时刻的记忆强度,α——与个体有关的个性衰减因子,β——与记忆信息类型有关的衰减系数。根据实际情况,该遗忘函数应当满足条件
当虚拟士兵对记忆信息进行调用时,该信息的记忆强度将会呈现阶跃式增长。为简化计算,分别记Mn、Mn+1为第n次和第n+1次调用时的记忆强度,对应的时间分别为tn和tn+1,记Mt为t时刻的记忆强度,对tn≤t<tn+1有Mt的表达式为
令△M=μ(1-Mn),则△M表示经过第n次调用后记忆强度的增量。其中 (1-Mn)为当前最大的记忆强度增量,μ为强度激活系数,且满足μ∈ (0,1]。
在此基础上,构建长时记忆的遗忘算法如下:
步骤1 初始化M0、βi(i=1,2,3,4,5)、α、μ;
步骤2 将记忆信息输入GMT的对应结点,并构造GMF;
步骤3 更新各叶子结点的M值,若tag=0,则按照式 (1)计算M;若tag=1,则按照式 (2)计算M;
步骤4 遍历记忆树的各个叶子结点,若有M<Mz,其中Mz为遗忘强度阈值,则删除该叶子结点;若分支结点包含的叶子结点为空,则删除该分支结点,以此类推;
步骤5 更新GMT的各结点信息,返回步骤3。
针对叶子结点被删除而有可能删除其父结点的情况,本文考虑3种 (如图6所示):
(1)被删结点具有不止一个的兄弟叶子结点或兄弟普通结点,则直接删除该叶子结点。
图6 叶子结点被遗忘的3种情形
(2)被删结点只有一个兄弟普通结点,而没有兄弟叶子结点,则用兄弟普通结点来替代其父结点;
(3)被删结点只有一个兄弟子结点而没有普通结点,则用它的兄弟叶子结点来取代它的父结点。
人类所谓的 “回忆”现象实质上是对记忆信息的搜索和调用。这一过程的实现就是在长时记忆存储系统中搜索信息的唯一标识ID,然后调用该ID对应的信息。依据目标ID的创建时间找到与其临近的GMT,然后针对GMT使用宽度优先算法可以保证找到目标结点。该算法描述如下:
步骤1 令N为初始结点的列表;
步骤2 若N为空,则退出并返回失败信号;
步骤3 令当前结点r为N中第一个结点,然后将r从N中移出;
步骤4 若r为目标结点,则退出并返回成功信号;步骤5 否则,将r的子结点插入到N的末尾,然后返回步骤2。
通过Matlab工具对上述遗忘算法进行了仿真实验,仿真的结果如图7-图9所示。
通过上述计算,可以看到不同的记忆类型和个性因子具有不同的遗忘曲线,并且记忆在遗忘的过程中如果得到学习,其记忆强度会阶跃式增加,这与艾宾浩斯的遗忘特性基本上能够吻合。
图9 经过t=50和t=100两次学习的遗忘曲线
本文针对虚拟士兵建模的需要,在分析现有记忆模型不足的基础上,对记忆信息进行了合理分类,构建了记忆信息的编码、存储结构和提取算法,并根据人类遗忘的特点,构造了记忆的遗忘算法,最后通过Matlab工具对算法进行了验证。结果表明该算法与实际情况基本相符,为进一步提高虚拟士兵的真实度和可信度提供了有益的借鉴。但是针对记忆信息的提取算法还有待于进一步改进,以期进一步减少计算消耗,提高搜索效率。
[1]CHEN Wencheng.Research and realization of virtual battlefield environment[D].Chengdu:Electronic Technology Universit,2009(in Chinese).[陈文成,虚拟作战训练环境的研究与实现 [D].成都:电子科技大学,2009.]
[2]LIU Weibin,ZHOU Liang,XING Weiwei,et al.Modeling realistic behaviors and movements of autonomous virtual humans [J].Transactions of Beijing Institute of Techonology,2010,30 (10):1189-1193.
[3]RONG Ming,WANG Qinzhao,LI Xiaolong.Study on 3Dvirtual soldier based on MDL model[J].Journal of System Simulation,2006,18 (4):1062-1064.
[4]YU Yang,JIANG Yuming.Simulation of 3Dvirtual soldiers training [J].Computer Engineering and Applications,2009,45 (22):166-168.
[5]SHI Jie,RONG Ming,LI Xiaolong,et al.Study on simulation of virtual soldier based on Cal3D [D].Hefei:University of Science and Technology of China,2009:532-535.
[6]ZHAO Wei,XIE Xiaofang.Research on aggressive behavior of autonomous virtual soldier [J].Computer Engineering and Applications,2010,46 (32):67-70.
[7]LU Wei,RONG Ming,LI Xiaolong,et al.Simulation research of appearance diversity about virsual solider[D].Hefei:University of Science and Technology of China,2009:370-373.
[8]ZHANG Shujun,BAN Xiaojuan,CHEN Yong,et al.Memorybased cognitive model of artificial fish[J].Computer Engineering,2007,33 (19):33-36.
[9]SUN Libo,SUN Jizhou,LIU Yan,et al.Model for virtual humans based the feedback control[J].Journal of Software,2010,21 (5):1171-1180.
[10]NI Hui.Research of the key technologies for autonomous virtual human [D].Tianjin:Tianjin University,2007 (in Chinese).[倪慧.自主虚拟人关键技术的研究 [D].天津:天津大学,2007.]
[11]LOU Yan,HE Hanwu,LU Yongming,et al.Research and implement on dynamic geometry vision model of virtual autonomous vehicle [J].Journal of System Simulation,2006,18(9):2676-2683.
[12]LI Bing.Perception model of autonomous virtual characters in intelligent virtual environmentss[D].Daqing:Daqing Institute of Petroleum,2008(in Chinese).[李冰.智能虚拟环境中自主虚拟角色感知模型的研究 [D].大庆:大庆石油学院,2008.]
[13]LU Qiuqin,HUANG Guangqiu,ZHOU Jiao.Model of intellectualized pinyin input method based on biological memory principles [J].Computer Engineering and Applications,2011,47 (9):56-60.
[14]SHI Zhongzhi.Intelligence science [M].Beijing:Tsinghua University Press,2006(in Chinese). [史忠植.智能科学[M].北京:清华大学出版社,2006.]
[15]ZUO Saizhe,GUO Yucui,GONG Shangbao,et al.Trust value update model based on the memory theory [J].Journal of Southeast University(Natural Science Edition),2010,40(z2):307-312.