边界框,通常也被称为包围体或边界区域,是一种几何结构,它能够精确地包围或涵盖数字图像中的一个物体或一组物体。其主要目的是在二维(2D)或三维(3D)空间中准确地确定物体的位置和大小,从而便于对物体进行流畅的操作和深入的分析。
在二维图像的情况下,边界框通常表示为矩形,其较长的边与图像平面的 x 轴和 y 轴平行排列。矩形的大小由 x 轴和 y 轴上的最小值和最大值决定,这些值由矩形四个角的坐标来指定。另外,矩形的尺寸和中心点也可用于构建包围框。
对于三维图像,边界框通常用平行六面体(三维矩形)来表示,其各边与图像空间的 x、y 和 z 轴平行。平行六面体的尺寸由其顶点的坐标确定,这些坐标指示了 x、y 和 z 轴上的最小值和最大值。同样,平行六面体的大小和中心也可用于确定边界框。