摘要:通信网络中的异常检测为发现新的攻击、错误配置和网络故障提供了依据。 数据存储、传输和处理的资源约束使得将输入数据限制在与检测任务高度相关的特性上,并且 (b)可以很容易地从网络观察中派生出来,而无需昂贵的操作。 去除强相关、冗余和不相关的特性也提高了基于学习技术的许多算法的检测质量。 本文讨论了基于网络流量的异常检测的特征选择问题。 我们提出了一种采用过滤器和逐步回归包装器的多阶段特征选择方法。 我们的分析基于41个广泛采用的流量特征,这些特征出现在几个常用的流量数据集中。 结合特征选择方法,可以将原始特征向量从41个减少到16个。