T-Rex Label

类别平衡

类别平衡指的是不同类别中示例数量的相对分布情况。在机器学习和与数据相关的任务中,当每个类别的示例数量相对均衡时,模型通常能取得更好的性能表现。当某个特定类别的示例数量少得不成比例时,这个类别就被称为 “代表性不足”。相反,如果某个特定类别的实例数量比其他类别多得多,那么它就被认为是 “代表性过高”。