VAR_POP 函数用户手册

1. 函数概述

VAR_POP 是 TDengine 的聚合函数,用于计算总体方差(Population Variance),即衡量一组数据的离散程度。总体方差假定所有数据是总体数据而非样本数据。

2. 语法

SELECT VAR_POP(column_name) FROM meters [WHERE condition];
-- 或用于窗口聚合
SELECT VAR_POP(column_name) FROM meters [WHERE condition] INTERVAL(window_size);
  • column_name:需要计算方差的字段,必须为数值类型(如 FLOAT、DOUBLE、INT 等)。
  • meters:智能电表超级表名。
  • condition:可选,筛选数据的条件。
  • window_size:如 1h1d,窗口聚合单位。

3. 计算原理

总体方差公式:

σ² = Σ(xi - μ)² / N
  • σ²:总体方差
  • xi:第 i 个数据值
  • μ:总体均值
  • N:数据总数

4. 为什么要用 VAR_POP?

  • 数据波动性分析:方差越大,数据波动越明显。可用于监控电流、电压、功率等参数的稳定性。
  • 异常检测:方差异常增大,可能说明设备故障或用电异常。
  • 质量评估:评估电网或设备运行的稳定性。
  • 趋势分析:对比不同区域或设备的方差,发现用电模式变化。

5. 智能电表表结构举例

CREATE TABLE meters (
    ts TIMESTAMP,
    voltage FLOAT,
    current FLOAT,
    power FLOAT
) TAGS (
    groupid INT,
    location VARCHAR(50)
);

6. 使用场景举例

6.1 电压总体方差分析

SELECT VAR_POP(voltage) AS voltage_var_pop FROM meters WHERE ts >= NOW() - 1d;

说明:统计过去一天所有电表电压的总体方差,分析电网稳定性。


6.2 按区域分组分析电流方差

SELECT location, VAR_POP(current) AS current_var_pop FROM meters WHERE ts >= NOW() - 7d GROUP BY location;

说明:对比不同区域的电流波动情况。


6.3 按设备组分析功率方差

SELECT groupid, VAR_POP(power) AS power_var_pop FROM meters WHERE ts >= NOW() - 30d GROUP BY groupid;

说明:分析不同设备组的功率波动,辅助设备健康管理。


6.4 时间窗口分析

-- 每小时电压方差
SELECT VAR_POP(voltage) AS hourly_voltage_var FROM meters WHERE ts >= NOW() - 1d INTERVAL(1h);

-- 每日功率方差
SELECT VAR_POP(power) AS daily_power_var FROM meters WHERE ts >= NOW() - 30d INTERVAL(1d);

说明:监控电力参数在不同时间窗口内的波动性。


6.5 异常检测(嵌套查询)

SELECT groupid, location, voltage_var, current_var, sample_count
FROM (
    SELECT groupid, location, VAR_POP(voltage) AS voltage_var, VAR_POP(current) AS current_var, COUNT(*) AS sample_count
    FROM meters
    WHERE ts >= NOW() - 1h
    GROUP BY groupid, location
)
WHERE voltage_var > 9.0 OR current_var > 2.0;

说明:筛选出方差异常的设备组和区域,便于运维人员及时处理。


7. VAR_POP 与 STDDEV、STDDEV_POP 的区别

函数

计算内容

公式分母

结果类型

适用场景

VAR_POP

总体方差

N

DOUBLE

总体波动分析

STDDEV_POP

总体标准差

N

DOUBLE

总体波动分析

STDDEV

样本标准差

N-1

DOUBLE

样本推断、统计分析

  • VAR_POP 返回的是方差(波动的平方),STDDEV_POP 返回的是标准差(波动的实际值)。
  • 方差适合做数学建模、风险评估、异常检测等场景;标准差更适合直接反映数据的实际波动幅度。
  • STDDEV 用于样本数据推断总体特征,适合统计推断和假设检验。

8. 注意事项

  • 仅支持数值型字段。
  • NULL 值自动忽略。
  • 支持窗口聚合和分组聚合。
  • 不支持在 WHERE 子句中直接调用聚合函数,若需复杂筛选请使用嵌套查询。
  • 方差单位为原数据单位的平方。

通过合理使用 VAR_POP 函数,用户可以高效分析智能电表数据的波动性,辅助异常检测、设备健康管理和电网质量监控。