investigacion
Modelos multimodales en 2025: qué puede hacer realmente la visión por IA
Los LLMs con capacidad visual ya no son novedad, pero sus capacidades reales varían mucho. Repasamos qué funciona bien en visión, dónde fallan todavía y las arquitecturas que lo hacen posible.
#multimodal#visión#gpt-4v
Equipo Blog IA
Leer