T-Rex Label
    用語集に戻る

    Cross-Modal Agent

    background
    DINO-X
    インタラクティブ・アノテーション
    複雑なシナリオのアノテーションでお困りですか? 選択してラベル付け!T-Rex2が視覚的なプロンプトを瞬時に読み取ります。

    Cross-modal agents integrate text, image, and video inputs to perform tasks like visual question answering and multi-modal content generation. They improve accuracy in complex scenarios.

    background
    AI事前アノテーション
    AI事前アノテーション
    DINO-Xによる全自動アノテーションを体験 —ターゲットを指定すれば、あとはAIにお任せ。