数据样本中的异常值(Outlier)通常是指一个类别型变量(Category)里某个类别值得次数太少、太稀有,比如出现的效率只有0.1%或更少,或者指一个区间型变量(Lnterval)里某些值取值太大。 在数据挖掘实践中,对于“异常值”的处理是辩证的,在多数情况下,异常值的删除可以有效降低数据的波动,使得处理后的建模数据更加稳定,从而提高模型的
Copyright © 2005-2025 51CTO.COM 版权所有 京ICP证060544号