
加权方差(Weighted Variance)是一种统计量,用于衡量数据集中各数值与其加权平均数之间的离散程度。在计算过程中,每个数据点根据其重要性或权重被赋予不同的影响力。以下是加权方差的计算公式及其步骤:
1. 计算加权平均数(Weighted Mean, μ_w)
首先,需要计算数据的加权平均数。假设有一组数据 $x_1, x_2, ..., x_n$ 和对应的权重 $w_1, w_2, ..., w_n$,则加权平均数的公式为:
[ \mu_w = \frac{\sum_{i=1}^{n} w_i x_i}{\sum_{i=1}^{n} w_i} ]
其中,$\sum$ 表示求和操作。
2. 计算加权方差(Weighted Variance, σ_w^2)
有了加权平均数后,接下来计算加权方差。加权方差的公式为:
[ \sigma_w^2 = \frac{\sum_{i=1}^{n} w_i (x_i - \mu_w)^2}{\sum_{i=1}^{n} w_i} ]
这里需要注意几点:
- $(x_i - \mu_w)^2$ 是每个数据点与加权平均数之差的平方。
- 每个这样的平方差都被其相应的权重 $w_i$ 所加权。
- 最后的结果再除以权重的总和 $\sum_{i=1}^{n} w_i$,以确保方差是一个无量纲的量(如果原始数据和权重都是无量纲的)。
示例
假设有以下数据集和权重:
- 数据集:$x = [2, 4, 6, 8]$
- 权重:$w = [1, 2, 3, 4]$
步骤 1: 计算加权平均数
[ \mu_w = \frac{1 \cdot 2 + 2 \cdot 4 + 3 \cdot 6 + 4 \cdot 8}{1 + 2 + 3 + 4} = \frac{2 + 8 + 18 + 32}{10} = \frac{60}{10} = 6 ]
步骤 2: 计算加权方差
[ \sigma_w^2 = \frac{(2 - 6)^2 \cdot 1 + (4 - 6)^2 \cdot 2 + (6 - 6)^2 \cdot 3 + (8 - 6)^2 \cdot 4}{1 + 2 + 3 + 4} ] [ = \frac{(-4)^2 \cdot 1 + (-2)^2 \cdot 2 + 0^2 \cdot 3 + 2^2 \cdot 4}{10} ] [ = \frac{16 \cdot 1 + 4 \cdot 2 + 0 \cdot 3 + 4 \cdot 4}{10} ] [ = \frac{16 + 8 + 0 + 16}{10} ] [ = \frac{40}{10} ] [ = 4 ]
因此,该数据集的加权方差为 4。
通过上述步骤,您可以计算任何给定数据集及其对应权重的加权方差。
