xiaomi

Xiaomi: MiMo-V2-Omni

Name: Xiaomi: MiMo-V2-Omni
Brand: Xiaomi
Price: 0.4800 USD
Availability: InStock

MiMo-V2-Omni is a frontier omni-modal model that natively processes image, video, and audio inputs within a unified architecture. It combines strong multimodal perception with agentic capability - visual grounding, multi-step planning, tool use, and code execution - making it well-suited for complex real-world tasks that span modalities, 256K context window.

Try in playground API reference

262,144 context

Modalities:text, image, audio, video->text

Released:3/18/2026

Weekly tokens

4.5B

Tokens generated this week (network-wide)

Usage by period

No ranking data yet for this model.