T-Rex Label

真实标签(ground truth)

在机器学习(ML)领域,ground truth 指的是给定数据集的准确或真实的标签及注释。它是评估机器学习模型性能的基本基准,同时也用于模型的训练和验证。

例如,在开发一个用于对动物图像进行分类的机器学习模型时,ground truth 就是每张图像的正确标签,比如 “猫”“狗” 或 “鸟”。模型会在包含图像及其相应真实标签的数据集上进行训练。之后,通过模型对新的、未见过的图像预测正确标签的准确程度来评估其性能。

尤其是对于大型数据集而言,获取真实标签是一个艰巨且耗时的过程。这通常需要仔细地审查并标注数据集中的每个实例,这需要耗费大量的时间和精力。在某些情况下,可以使用自动化方法来生成真实标签,然而这些方法可能不太可靠,通常还需要额外的人工审查和修正。