人工智能技术在作战筹划系统中的应用研究
【线上直播】11月21日晚8点贝壳技术总监侯圣文《数据安全之数据库安全黄金法则》
近年来,人工智能技术取得突破性进展,各国都认识到人工智能技术的战略意义,从国家战略层面开始加紧布局,加强人工智能在军事方面的研究和应用。美国将人工智能视为“改变游戏规则”的颠覆性技术,美国国防部已明确把人工智能作为第三次“抵消战略”的重要技术支柱。该战略围绕抵消中、俄非对称制衡能力,瞄准打造智能化作战体系,发展颠覆性前沿技术。
根据美军的作战条令JP 5-0《联合作战计划》,美军的作战筹划过程联合作战计划流程(JOPP)包括:受领任务、任务分析、行动方案生成、行动方案分析、推演和评估以及行动方案执行。目前,美军已经将人工智能技术广泛应用于作战筹划的整个流程,如美国陆军的“深绿”系统已经将人工智能技术用于从受领任务到行动方案生成的三个步骤、美国空军的Alpha AI空战仿真系统已经在仿真环境下将人工智能技术用于整个作战筹划流程,本文梳理了作战筹划流程中可使用的各种人工智能技术。
1.人工智能用于任务分析
在任务分析阶段,分析人员需要处理和融合信息以生成一张通用作战图(COP)。为完成该任务,分析人员需要对接收的信息进行分类并确定当前态势以构建动态更新的COP,此外,还需要检测己方系统是否被欺骗。在信息融合技术的辅助下,战术级系统可根据接收到的情报报告的顺序自动生成战术级COP。任务分析过程中的信息处理可分为三种类型:发现信息、编辑信息和探测信息中的异常。
1.1 发现信息
通常情况下,发现信息需要找到与特定主题相关的类似文档。如果所有文件都有与主题相关的元标签,则处理过程较快。元标签的标注过程可使用半监督学习自动执行。Salakhutdinov和Hinton提出了一种以深度自动编码器的形式,利用深度学习算法将高维度文件输入向量转换为一种低维度本征向量空间的方法,在该空间中互邻的向量与类似的文档对应。自动编码器的学习过程可以一种无监督学习的形式执行。可利用少量有主题标记的样本来定义本征向量空间中的特定聚类,并使用这些聚类来构建自动元标注算法。
图1 深度语义哈希算法
1.2 编辑信息
发现信息后可使用人工智能算法确定一个文档中与特定话题相关的实体。例如,提取与后勤相关的项目和数字可加速部队机动的计划过程。在自然语言处理中,这一问题被称为指定实体识别,将神经网络与指定实体字典进行结合可产生良好效果。
图2 识别实体算法
1.3 探测异常信息
探测异常信息通常以深度自动编码器技术为基础,正常的数据点位于自动编码器构建模型的非线性低维度嵌入坐标中,因此当自动编码器对正常数据点进行解码时重建错误较少,而异常信息的重建错误较多。这种方法可用于各种问题,包括探测接收的传感器数据中的异常和标记异常报告。除此之外,近期的研究成果还可区分两句话是否存在冲突。
图3 异常探测算法
2.人工智能用于行动方案(COA)生成
对于计划过程而言,人工智能与仿真环境相结合的方法较为成熟,可使用深度强化学习算法来制定行动方案,这种算法可在仿真环境中执行试错实验以度量不同计划的期望效应。仿真环境应尽可能贴近现实,反映战场上各种作战行动所带来的效应,以及道德、后勤供应和难民等其他因素对作战行动的影响。
2008年,美国防高级研究计划局(DARPA)开发了一个被称为“深绿”的军用战术指挥与控制系统,该系统可为指挥官生成行动方案,以便其更主动地管理作战行动,2013年,DARPA已经将该项目转交给了美国陆军。
图4 强化学习算法
3.人工智能用于行动方案分析和推演
在计划制定过程中,可使用定性方法来分析计划。对于定性COA分析而言,当不同的计划小组提出了几种COA后,可使用概念框架来登记领域专家对这些COA的评论,这些专家使用一个模板来创建结构化评论并系统地评估不同COA的各方面特征。之后,可使用一种能够区分各种辩论模型间相同和不同之处的框架来选择和总结各领域专家对不同COA的评论,这种方法可实现对备选COA的结构化分析。
除了定性分析COA外,还可使用定量分析方法。Abbass和Bender在《计算红蓝对抗:过去、现在和未来》一文中提出,可采用将人工智能与多智能体系统进行组合,开展红蓝对抗。这种方法可使指挥官了解各种行动方案的优缺点与动态推演过程中可能存在的事件进展,评估各种行动方案的优缺点和了解敌方行动。
此外,北约最近利用数据耕耘技术(如大规模平行仿真、数据分析和可视化)开发了用于决策支持的数据耕耘系统,该系统可分析不同仿真系统对地面作战计划产生的几十万个仿真输出结果。这是一种将仿真与大数据分析相结合的方法。
4.人工智能用于计划执行
4.1 为指挥官生成备选行动方案
在执行计划时,可利用人工智能技术快速融合和分析战场信息以便将结果发送给指挥官。指挥官在高压战场环境下需要准确的信息来做出关键决策,但是指挥官通常会获得大量信息,容易产生信息过载的风险。当信息不是以一种符合逻辑、简洁和有意义的形式提供给指挥官时就容易产生问题。在计划执行期间,伴随着战场态势的快速变化,原计划可能会随时失效,因此指挥官需要较快的重新计划能力。人工智能技术可为指挥官及时提供备选方案。
机器学习可用于开发作战战术。但是很多机器学习算法的运算速度不够快,难以使智能体在空战这样的环境中发现最优作战策略。Q学习是一种强化学习算法,可用于空战目标分配。该算法可在不使用大型数据集或推理信息的情况下学习最优智能体的状态和行为组合。
有时人工智能算法需要一系列类似场景的行为原则。在这种情况下,可使用迁移学习来减少学习时间。例如,在不同的2对2空战场景中学习作战规则时,可使用已经具备2对1空战场景经验的智能体。实验研究表明,这类智能体具备作战优势,因为这样可最小化进一步的学习过程。使用迁移学习可快速开发一个智能体在新场景中的行为。