最小机会损失决策与不确定型决策法里的最小机会损失决策准则相类似,都是先将收益矩阵的中各元素变换为机会损失值。将各自然状态下的最大收益值定为理想目标,并将该状态中的其他值与最高值之差称为机会损失值。然后求这些机会损失值的期望损失值,最后从中选取最小的期望损失值,对应的策略即为决策者所选的策略。
计算步骤首先计算出当发生 j 事件后,各策略的收益最大值
aij = max ( aij )
这时各策略的机会损失值为
\(a'_{ij}\) = { max ( aij ) - aij }
然后求这些机会损失值的期望损失值,最后从中选取最小的期望损失值
min \(\sum_{j} p_ja'_{ij}\)
计算公式S*k\(\rightarrow\) min \(\sum_{j} p_ja'_{ij}\)
计算结果 (策略\事件) E1 = 0 E2 = 10 E3 = 20 E4 = 30 E5 = 40 EOL事件概率(pj) 0.1 0.2 0.4 0.2 0.1
S1 = 0 0 50 100 150 200 100
S2 = 10 10 0 50 100 150 56
S3 = 20 20 10 0 50 100 24
S4 = 30 30 20 10 0 50 16 \(\longleftarrow\) max
S5 = 40 40 30 20 10 0 20
根据 EOL 决策准则有
min (100, 56 , 24, 16, 20) = 16
对应的决策策略为 S4,为决策者选择的策略。
从本质上讲 EMV 与 EOL 决策准则是一样的。所以决策时这两个决策结果是一样的。
计算代码 /** * 最小机会损失决策准则(EOL) * @param matrix * @param row * @param col */ private static void EOL(double[][] matrix, int row, int col){ //先求损失矩阵 double[][] loss = new double[row+1][col]; for (int j = 0; j < col; j++) { loss[0][j] = matrix[0][j]; //将自然概率复制到损失矩阵的第一行中 double max = matrix[1][j]; //先定每一列的第一个最大 for (int i = 1; i <= row; i++) { if(matrix[i][j] > max){ max = matrix[i][j]; } } //此时已经求出该列的最大值 //损失矩阵中对应位置的值 = 决策矩阵中列最大值 - 决策矩阵中对应位置值 for (int i = 1; i <= row; i++) { loss[i][j] = max - matrix[i][j]; } } //然后再求 EOL 决策 double[] maxMar = new double[row+1]; double min = 0.0; double temp = 0.0; int minIndex = 0; double chance = 0.0; for (int i = 1; i <= row; i++) { for (int j = 0; j < col; j++) { chance = loss[0][j]; //自然概率 temp = (j != 0) ? (temp + loss[i][j]*chance) : (loss[i][j]*chance); } maxMar[i] = temp; if(i == 1){ min = temp; minIndex = 1; } else if(temp < min){ min = temp; minIndex = i; } } System.out.println(Arrays.toString(maxMar)); System.out.println(min+"--"+minIndex); } 全情报的价值(EVPI) 定义当决策者耗费了一定经费进行调研,获得了各事件发生概率的信息,应采用 ”随机应变“ 的战术,这时所得的期望收益称为全情报的期望收益,记做 EPPI,这个收益应当大于至少等于最大期望收益,即 EPPI >= max(EMV),则有EVPI = EPPL - max(EMV),EVPI 称为全情报的价值,这就说明获得情报的费用不能超过 EVPI 值,否则就没有增加收入。
计算步骤先进行 EMV 决策法计算,求得最大期望收益值
max \(\sum_{j} p_ja_{ij}\)
然后求全情报期望收益,先得求收益矩阵中每行的最大值然后求期望,最后将每行最大值的期望相加,得到全情报期望收益。
\(\sum_{j} p_jmax(a_{i})\) ; \(max(a_{i})\) 是 i 行的最大值
全情报期望收益减去最大期望收益即为全情报价值 EVPI
EVPI = \(\sum_{j} p_jmax(a_{i})\) - max \(\sum_{j} p_ja_{ij}\)
计算公式