investigacion
Constitutional AI: cómo Anthropic entrena modelos para alinearse con principios sin feedback humano exhaustivo
CAI es la técnica de Anthropic para reducir comportamientos dañinos usando al propio modelo como crítico. Explicamos el mecanismo y por qué importa para quienes construyen aplicaciones con LLMs.
#anthropic#alineamiento#constitutional-ai
Equipo Blog IA
Leer