LocateAnything-3B

nvidia/LocateAnything-3B

Get AI Model →

⬇

407.8K

Downloads

❤️

2.4K

Likes

🏷️

Model Details

Full Model IDnvidia/LocateAnything-3B

Pipeline / Taskimage-text-to-text

Librarytransformers

Downloads (all-time)407.8K

Likes2.4K

Last Modified6/12/2026

Author / Orgnvidia

PrivateNo — public

⚡ Quick Usage (Python)

Using the 🤗 Transformers library. Install with pip install transformers

from transformers import pipeline

# Load the model
pipe = pipeline("image-text-to-text", model="nvidia/LocateAnything-3B")

# Run inference
result = pipe("Your input here")
print(result)

🏷️ Tags

transformerssafetensorslocateanythingfeature-extractionnvidiaeaglevisionobject-detectiongroundingarxiv:2605.27365image-text-to-textconversationalcustom_codeenarxiv:2504.07491arxiv:2109.10852arxiv:2510.12798arxiv:2303.05499arxiv:1405.0312arxiv:1908.03195arxiv:2504.07981base_model:Qwen/Qwen2.5-3B-Instructbase_model:finetune:Qwen/Qwen2.5-3B-Instructlicense:otherregion:us