找回密码
 Register
搜索
查看: 39|回复: 0

政工推演的基本原理

[复制链接]
发表于 前天 09:12 | 显示全部楼层 |阅读模式
兵棋推演的目的是考察指挥员的认知态度,解决从认识来源、认识过程的发展规律来研究主客观相符合的问题。从根本上说,政工推演的基本原理应当遵循动态认知逻辑和群体信念动态变化。

对我个人而言,政工推演的全部研究在兵棋推演基础科学中的优先级不高,只有在构建基本的数学空间以后才会腾出手来考察它,但不妨简单来说一说。

若想考察指挥员的认知态度,需要具有手段去做意图分析。作为类比,在强化学习中,主体的目标被形式化表征为一种特殊信号,称为收益,它通过环境传递给主体。而在主动推理中,主体的目标被形式化表征为另一种特殊信号,称为偏好状态,同样是通过环境传递给主体。主体的偏好状态反映了主体的生存条件,在与环境的互动中偏好状态会发生偏离,这就反映出主体生存条件的变化。而主体的意图,或者说军事行动企图,是控制环境状态再次向偏好状态转移的驱动力。

在主动推理中,状态的转移是通过主体行动完成的,所以问题的关键不在于如何理解世界,而在于如何改造世界。我方与敌方的意图交织在一起共同对战场进行作战塑造,必然有的行动直接反映了敌我各自的意图,而有的行动扭曲地反映了敌我各自不真实的意图(也就是欺骗)。但对于环境状态,我们并不会直接区分出哪些是真实的,哪些是虚伪的,这样环境所提供的线索充满了不确定性。正是出于此原因,在主动推理中,我们称之为隐藏状态,主动推理的目的,或者说意图分析的目的,就是识别隐藏状态背后真实的目的。

从这个角度来看,考察指挥员认知态度的方法其实就是一种意图分析论。

在主动推理中,意图分析的核心是找到反映指挥员构造作战过程的证据,这是数学术语,它对应的军事术语即征候,也就是可供判断军事行动企图的各种迹象,而我们使用信念来衡量证据的可信度或者强度。因为要推演反事实的情况,就必须要求对兵棋推演的叙述(叙述学使命)必须符合可能世界语义学,则对信念的解释为:

在世界w上主体u相信命题φ,当且仅当,在所有u-认为最合理的世界上φ都是真的。


无论是政治思想教育,还是政治心理战,首先要抽象掉它们的外在形式。我们姑且将军队当中人与人交往的空间,称作军事社会网络,其中每个军人(主体)通过各种职务之间的关系与其他主体相互连接,并借由这些关系通道展开信息交流与互动。一个主体观念的形成、信念的改变、行为方式的选择等都会受到周遭战友或指挥员的影响。

从逻辑学角度探讨军事社会网络,主要是研究信息及其流动的规律。在认知方面,研究主体如何在军事社会网络中接收信息、形成自己的信念;在行为方面,研究主体行为方式的选择如何受到周遭战友或指挥员的影响。由此逐步使用量化模型对信念修正进行研究,将主体相互之间的影响看作一个不断动态变化的过程,对这个过程本身的性质进行研究,理解在军队中主体政治心理的信念变化规律。

这项工作有三个关键因素:第一,关于信念的表征;第二,关于群体中主体之间军事社会关系的表征;第三,关于对动态变化部分的建模。

对于信念,采用在阈值模型上针对一个命题φ,主体相信φ时值为1,不相信φ时值为0,并称之为二元质化信念。由此得到一个包含有n个主体的初始信念状态,即n×1的列向量。

而将军事社会关系抽象成主体之间的信任度,使用信任矩阵来表征。由此得到一个n×n的方阵,每一行的信用度是主观概率,表示主体下一步相信命题φ的概率,值域为[0,1],每一行之和为1,表示一个主体对包括自己在内的n个主体的信任分布。

从数学上看,主体信念在军事社会关系影响下的变化,就是初始信念状态与信任矩阵的乘积,结果仍是一个n×1的列向量,每一行是对应主体相信命题φ的客观概率,值域为[0,1],即客观的多大程度上主体会在下一步相信φ。

于是,给定群体成员当下的信念状态、群体内部的信念矩阵,每一轮更新可以给出每个主体下一步的信念状态。对主体而言,每一轮更新都是一次观点的聚合,每次执行聚合都决定主体下个阶段的信念。

由于一个主体相信命题φ的可能性与其他主体相信该命题的可能性无关,可以通过把每个主体相信和不相信给定命题的对应概率,与其他所有主体的信念状态(每个都取值为1和0)分别相乘,得到该主体的二元信念,进而组成一个2ⁿ×2ⁿ的方阵,每个数字的值域为[0,1],每一行之和为1,即该群体从初始信念状态开始不断演化的转换矩阵,又称迭代矩阵。

上述过程乃是建立军事单位或者军事力量(在定远 Notebook中称作规模点)的二元信念模型,进而可以定义群体信念概念,即群体的潜在信念。

我们这里略去严格的数学定义。所谓政工的积极结果,就是该群体对于给定命题具有潜在的信念,当且仅当,在足够多的转换次数中,初始信念状态迭代为相信命题的概率>0.5。

群体信念是军事社会影响的结果,主体之间的相互影响在群体信念形成过程中至关重要。定义群体信念的关键是高概率趋于共识,群体成员的信念变化都是基于客观的转换概率,要求信念高于阈值0.5的群体趋向达成共识。而“在足够多的转换次数中”则反映了达成共识的稳定性。

这就是信念在马尔可夫链中的迭代,并使用迭代矩阵描述“给定当前的信念状态,k步之后马尔可夫链转换到其他信念状态的概率分布”。当然,可以证明,在特定的约束下,迭代矩阵会收敛到一个极限矩阵。收敛,自然意味着稳态的出现,存在一个流形上的不动点,有助于我们做临界分析。

顺着这条分析路径走下去,可以考察一个局部“先进”的有穷群体,是否可以在迭代中共同习得真理,比如“为谁打仗”或者“任务在全局中的地位”等命题,这就是党小组或者士兵委员会的作用。对这个问题持消极态度的有穷群体,存在一个群体外的主体,能够采取措施使得群体内部成员朝着真理的方向学习,这就是政策制定者或政委、政治指导员的作用。

最终,迭代矩阵将成为一个参数,被纳入到主动推理框架,与其他参数共同构成指挥员对于作战指挥的生成模型。当遇到与“实现组织持存”原则相矛盾的牺牲问题时,主动推理框架和结构因果模型能够涵盖“牺牲局部换取全局胜利”的极端偏好状态,而习得真理的群体会将“避免组织消亡”这个辩证逻辑反项调整为它的对立,即“接受组织消亡”,以确保极端偏好状态具备贝尔曼最优性。只有这样的生成模型才能回答在西方兵棋体系中“士气崩溃论”推演不出的战争结局。

您需要登录后才可以回帖 登录 | Register

本版积分规则

QQ|Archiver|手机版|小黑屋|Velonica

GMT+8, 2025-11-21 01:59 , Processed in 0.024031 second(s), 16 queries .

Powered by Discuz! X3.5

© 2001-2025 Discuz! Team.

快速回复 返回顶部 返回列表