<?xml version="1.0" encoding="UTF-8"?><rss version="2.0"><channel><title>Blog IA para devs</title><description>Noticias, análisis y tutoriales sobre modelos de inteligencia artificial para desarrolladores.</description><link>https://blog-ia.example.com/</link><language>es</language><item><title>Desplegar un modelo con Ollama en un servidor Linux: guía de producción</title><link>https://blog-ia.example.com/blog/desplegar-modelo-ollama/</link><guid isPermaLink="true">https://blog-ia.example.com/blog/desplegar-modelo-ollama/</guid><description>Ollama en tu laptop funciona bien para desarrollo. Para un servidor compartido con varios usuarios o para integrarlo en una aplicación, hay configuración extra necesaria. Esta guía cubre el setup completo.</description><pubDate>Wed, 10 Dec 2025 00:00:00 GMT</pubDate><category>tutorial</category><category>ollama</category><category>deployment</category><category>linux</category><category>self-hosted</category><author>Equipo Blog IA</author></item><item><title>Lo que 2026 tiene preparado para los developers que trabajan con IA</title><link>https://blog-ia.example.com/blog/predicciones-ia-2026/</link><guid isPermaLink="true">https://blog-ia.example.com/blog/predicciones-ia-2026/</guid><description>Agentes más autónomos, modelos multimodales más capaces, y la consolidación del mercado de herramientas. Sin bola de cristal, pero con los indicadores que ya están sobre la mesa.</description><pubDate>Mon, 01 Dec 2025 00:00:00 GMT</pubDate><category>opinión</category><category>opinión</category><category>predicciones</category><category>2026</category><category>tendencias</category><author>Equipo Blog IA</author></item><item><title>Streaming de LLMs en aplicaciones web: implementación completa con SSE y React</title><link>https://blog-ia.example.com/blog/streaming-respuestas-llm/</link><guid isPermaLink="true">https://blog-ia.example.com/blog/streaming-respuestas-llm/</guid><description>Los streams transforman la experiencia de usuario al mostrar texto mientras se genera. Guía de implementación en el backend (Node.js) y frontend (React) usando Server-Sent Events con OpenAI y Anthropic.</description><pubDate>Sat, 22 Nov 2025 00:00:00 GMT</pubDate><category>tutorial</category><category>streaming</category><category>react</category><category>sse</category><category>tutorial</category><author>Equipo Blog IA</author></item><item><title>Anthropic vs OpenAI: no son lo mismo aunque compitan en el mismo mercado</title><link>https://blog-ia.example.com/blog/anthropic-vs-openai/</link><guid isPermaLink="true">https://blog-ia.example.com/blog/anthropic-vs-openai/</guid><description>Las diferencias entre Anthropic y OpenAI van más allá del modelo. Filosofía de seguridad, acceso a herramientas, políticas de uso y visión a largo plazo marcan dos apuestas distintas sobre cómo construir IA.</description><pubDate>Mon, 10 Nov 2025 00:00:00 GMT</pubDate><category>opinión</category><category>anthropic</category><category>openai</category><category>comparativa</category><category>ecosistema</category><author>Equipo Blog IA</author></item><item><title>Cómo implementar tool use con Claude: guía práctica de function calling</title><link>https://blog-ia.example.com/blog/llamar-herramientas-claude/</link><guid isPermaLink="true">https://blog-ia.example.com/blog/llamar-herramientas-claude/</guid><description>Tool use permite que Claude invoque funciones definidas por ti para obtener información externa o ejecutar acciones. Implementación completa con TypeScript, manejo del ciclo de herramientas y patrones de error.</description><pubDate>Wed, 05 Nov 2025 00:00:00 GMT</pubDate><category>tutorial</category><category>anthropic</category><category>tool-use</category><category>agentes</category><category>tutorial</category><author>Equipo Blog IA</author></item><item><title>Qué le pasa a tu código cuando se lo envías a ChatGPT o Claude</title><link>https://blog-ia.example.com/blog/privacidad-datos-llms/</link><guid isPermaLink="true">https://blog-ia.example.com/blog/privacidad-datos-llms/</guid><description>Las políticas de uso de datos de OpenAI, Anthropic y Google son distintas entre sí y no siempre fáciles de entender. Resumen de lo que saben y lo que hacen con los datos que envías a sus APIs.</description><pubDate>Sat, 25 Oct 2025 00:00:00 GMT</pubDate><category>opinión</category><category>privacidad</category><category>datos</category><category>compliance</category><category>seguridad</category><author>Equipo Blog IA</author></item><item><title>Construir un chatbot con Vercel AI SDK y Next.js App Router en 30 minutos</title><link>https://blog-ia.example.com/blog/ai-sdk-vercel-nextjs/</link><guid isPermaLink="true">https://blog-ia.example.com/blog/ai-sdk-vercel-nextjs/</guid><description>Tutorial completo: interfaz de chat con streaming, historial de mensajes, cambio de modelo y manejo de errores. Usando el Vercel AI SDK con Next.js 14 App Router y TypeScript.</description><pubDate>Sat, 18 Oct 2025 00:00:00 GMT</pubDate><category>tutorial</category><category>vercel</category><category>next.js</category><category>chatbot</category><category>tutorial</category><author>Equipo Blog IA</author></item><item><title>La IA es una herramienta, no un oráculo: por qué la confianza ciega es el peor antipatrón</title><link>https://blog-ia.example.com/blog/ia-herramienta-no-oraculo/</link><guid isPermaLink="true">https://blog-ia.example.com/blog/ia-herramienta-no-oraculo/</guid><description>Los LLMs alucinan, tienen fechas de corte, no conocen tu contexto específico y a veces confunden certeza con precisión. Cómo usar IA con criterio sin dejar de aprovechar su potencial.</description><pubDate>Wed, 08 Oct 2025 00:00:00 GMT</pubDate><category>opinión</category><category>opinión</category><category>alucinaciones</category><category>criterio</category><category>mejores-prácticas</category><author>Equipo Blog IA</author></item><item><title>Bases de datos vectoriales: Pinecone, Weaviate, Qdrant o pgvector. Cuál elegir.</title><link>https://blog-ia.example.com/blog/vector-db-comparativa/</link><guid isPermaLink="true">https://blog-ia.example.com/blog/vector-db-comparativa/</guid><description>Cada base de datos vectorial tiene un caso de uso donde brilla. Comparamos las opciones principales en rendimiento, facilidad de uso, coste y cuándo tiene sentido each una para un proyecto real.</description><pubDate>Wed, 01 Oct 2025 00:00:00 GMT</pubDate><category>tutorial</category><category>vectordb</category><category>rag</category><category>pinecone</category><category>pgvector</category><author>Equipo Blog IA</author></item><item><title>El futuro no son los modelos más grandes. Son los más eficientes.</title><link>https://blog-ia.example.com/blog/modelos-pequenos-futuro/</link><guid isPermaLink="true">https://blog-ia.example.com/blog/modelos-pequenos-futuro/</guid><description>La carrera por el modelo más grande empieza a dar paso a una competencia por la eficiencia. Phi-3, Gemma 2 y las destilaciones de DeepSeek apuntan a un futuro donde el tamaño importa menos que la calidad del entrenamiento.</description><pubDate>Mon, 22 Sep 2025 00:00:00 GMT</pubDate><category>opinión</category><category>opinión</category><category>modelos-pequeños</category><category>eficiencia</category><category>destilación</category><author>Equipo Blog IA</author></item><item><title>Fine-tuning de GPT-4o Mini: cuándo hacerlo y cómo preparar los datos</title><link>https://blog-ia.example.com/blog/fine-tuning-gpt4o-mini/</link><guid isPermaLink="true">https://blog-ia.example.com/blog/fine-tuning-gpt4o-mini/</guid><description>OpenAI permite hacer fine-tuning de GPT-4o Mini con tus propios datos. Guía completa: preparación del dataset, formato JSONL, llamada a la API y evaluación del resultado.</description><pubDate>Mon, 15 Sep 2025 00:00:00 GMT</pubDate><category>tutorial</category><category>fine-tuning</category><category>openai</category><category>gpt-4o-mini</category><category>tutorial</category><author>Equipo Blog IA</author></item><item><title>Vibe coding: cuando dejar de entender el código que escribes empieza a ser un problema</title><link>https://blog-ia.example.com/blog/vibe-coding-reflexion/</link><guid isPermaLink="true">https://blog-ia.example.com/blog/vibe-coding-reflexion/</guid><description>El término &apos;vibe coding&apos; describe desarrollar aceptando código de IA sin entenderlo completamente. Hay casos donde es una herramienta válida. Hay muchos más donde es una trampa.</description><pubDate>Fri, 05 Sep 2025 00:00:00 GMT</pubDate><category>opinión</category><category>opinión</category><category>vibe-coding</category><category>calidad</category><category>deuda-técnica</category><author>Equipo Blog IA</author></item><item><title>Prompt caching en Anthropic: cómo ahorrar 90% en costes con contexto estático</title><link>https://blog-ia.example.com/blog/prompt-caching-anthropic/</link><guid isPermaLink="true">https://blog-ia.example.com/blog/prompt-caching-anthropic/</guid><description>El caching de Anthropic permite reutilizar contexto largo entre llamadas. Guía de implementación con TypeScript para system prompts, documentos de referencia y herramientas definidas.</description><pubDate>Thu, 28 Aug 2025 00:00:00 GMT</pubDate><category>tutorial</category><category>anthropic</category><category>optimización</category><category>costes</category><category>tutorial</category><author>Equipo Blog IA</author></item><item><title>El coste real de las APIs de IA en producción: lo que nadie te cuenta antes</title><link>https://blog-ia.example.com/blog/coste-real-apis-ia/</link><guid isPermaLink="true">https://blog-ia.example.com/blog/coste-real-apis-ia/</guid><description>Los precios por millón de tokens son fáciles de encontrar. Lo que no es tan obvio: el coste del contexto largo, el caching, los tokens de razonamiento ocultos y cómo los patrones de uso real difieren de los ejemplos del playground.</description><pubDate>Wed, 20 Aug 2025 00:00:00 GMT</pubDate><category>opinión</category><category>costes</category><category>api</category><category>producción</category><category>optimización</category><author>Equipo Blog IA</author></item><item><title>Open source vs modelos propietarios: la elección real en 2025</title><link>https://blog-ia.example.com/blog/open-source-vs-cerrado/</link><guid isPermaLink="true">https://blog-ia.example.com/blog/open-source-vs-cerrado/</guid><description>Llama 3, Mistral y DeepSeek cerraron la brecha de calidad con GPT-4 y Claude. Pero la elección no es solo de rendimiento: hay licencias, infraestructura, latencia y privacidad en juego.</description><pubDate>Fri, 01 Aug 2025 00:00:00 GMT</pubDate><category>opinión</category><category>open-source</category><category>propietario</category><category>arquitectura</category><category>decisiones</category><author>Equipo Blog IA</author></item><item><title>Construir un sistema RAG con LangChain en Python: de cero a producción</title><link>https://blog-ia.example.com/blog/construir-rag-langchain/</link><guid isPermaLink="true">https://blog-ia.example.com/blog/construir-rag-langchain/</guid><description>Tutorial completo para construir recuperación aumentada generativa. Cargamos documentos, generamos embeddings, indexamos en Chroma y construimos la cadena de QA. Con variantes para escalar a producción.</description><pubDate>Mon, 28 Jul 2025 00:00:00 GMT</pubDate><category>tutorial</category><category>langchain</category><category>rag</category><category>python</category><category>tutorial</category><author>Equipo Blog IA</author></item><item><title>Structured Outputs de OpenAI: JSON garantizado sin parsear texto libre</title><link>https://blog-ia.example.com/blog/openai-structured-outputs/</link><guid isPermaLink="true">https://blog-ia.example.com/blog/openai-structured-outputs/</guid><description>Con Structured Outputs, GPT-4o puede garantizar que su salida se ajuste exactamente a un schema JSON. Cómo implementarlo, cuándo usarlo y qué diferencia hay con el modo JSON anterior.</description><pubDate>Mon, 28 Jul 2025 00:00:00 GMT</pubDate><category>tutorial</category><category>openai</category><category>structured-outputs</category><category>json</category><category>tutorial</category><author>Equipo Blog IA</author></item><item><title>El ciclo del hype de la IA en 2025: qué cumplió y qué sigue siendo promesa</title><link>https://blog-ia.example.com/blog/hype-ia-2025/</link><guid isPermaLink="true">https://blog-ia.example.com/blog/hype-ia-2025/</guid><description>Cada semana hay un nuevo modelo o herramienta que &apos;lo cambia todo&apos;. Un año después, ¿qué realmente cambió en cómo los desarrolladores construyen software? Balance sin filtros.</description><pubDate>Tue, 15 Jul 2025 00:00:00 GMT</pubDate><category>opinión</category><category>opinión</category><category>hype</category><category>balance</category><category>2025</category><author>Equipo Blog IA</author></item><item><title>Primeros pasos con la API de Anthropic: de cero a tu primera llamada en 10 minutos</title><link>https://blog-ia.example.com/blog/primeros-pasos-anthropic-api/</link><guid isPermaLink="true">https://blog-ia.example.com/blog/primeros-pasos-anthropic-api/</guid><description>Guía práctica para usar la API de Claude desde TypeScript o Python. Cuenta, instalación, primera llamada, streaming y manejo de errores. Todo lo que necesitas para empezar.</description><pubDate>Thu, 10 Jul 2025 00:00:00 GMT</pubDate><category>tutorial</category><category>anthropic</category><category>api</category><category>tutorial</category><category>typescript</category><author>Equipo Blog IA</author></item><item><title>La IA no va a reemplazar a los programadores. Va a cambiar qué significa serlo.</title><link>https://blog-ia.example.com/blog/ia-reemplazara-programadores/</link><guid isPermaLink="true">https://blog-ia.example.com/blog/ia-reemplazara-programadores/</guid><description>La pregunta no es si la IA reemplaza a los desarrolladores, sino qué partes del trabajo se automatizan y qué nuevas habilidades se vuelven más valiosas. Una lectura sin dramatismo.</description><pubDate>Tue, 01 Jul 2025 00:00:00 GMT</pubDate><category>opinión</category><category>opinión</category><category>futuro</category><category>desarrolladores</category><category>productividad</category><author>Equipo Blog IA</author></item><item><title>Chain-of-Thought: la técnica de prompting que cambió qué podemos pedirle a un LLM</title><link>https://blog-ia.example.com/blog/chain-of-thought-prompting/</link><guid isPermaLink="true">https://blog-ia.example.com/blog/chain-of-thought-prompting/</guid><description>Pedir al modelo que &apos;piense paso a paso&apos; mejora drásticamente los resultados en problemas de razonamiento. Explicamos por qué funciona, las variantes más efectivas y cuándo no es la herramienta adecuada.</description><pubDate>Wed, 18 Jun 2025 00:00:00 GMT</pubDate><category>investigacion</category><category>prompting</category><category>chain-of-thought</category><category>razonamiento</category><category>técnicas</category><author>Equipo Blog IA</author></item><item><title>Ventanas de contexto largas vs RAG: no es una elección binaria</title><link>https://blog-ia.example.com/blog/context-window-tecnicas/</link><guid isPermaLink="true">https://blog-ia.example.com/blog/context-window-tecnicas/</guid><description>Con modelos que aceptan 1M de tokens, ¿sigue teniendo sentido construir pipelines de RAG? La respuesta depende del caso de uso. Aquí el análisis técnico honesto.</description><pubDate>Wed, 18 Jun 2025 00:00:00 GMT</pubDate><category>investigacion</category><category>context-window</category><category>rag</category><category>arquitectura</category><category>gemini</category><author>Equipo Blog IA</author></item><item><title>NotebookLM: Google crea la herramienta de investigación con IA que tiene sentido usar</title><link>https://blog-ia.example.com/blog/google-notebooklm/</link><guid isPermaLink="true">https://blog-ia.example.com/blog/google-notebooklm/</guid><description>NotebookLM deja subir tus propios documentos y hace preguntas sobre ellos con contexto real. El modo Audio Overviews que genera podcasts a partir de PDFs fue inesperadamente viral. Repasamos qué hace bien.</description><pubDate>Thu, 12 Jun 2025 00:00:00 GMT</pubDate><category>herramientas</category><category>google</category><category>notebooklm</category><category>rag</category><category>productividad</category><author>Equipo Blog IA</author></item><item><title>Cómo leer los benchmarks de LLMs sin dejarte engañar por los números</title><link>https://blog-ia.example.com/blog/benchmarks-como-leerlos/</link><guid isPermaLink="true">https://blog-ia.example.com/blog/benchmarks-como-leerlos/</guid><description>MMLU, HumanEval, GPQA, MT-Bench, LMSYS Arena: cada benchmark mide algo diferente y tiene sus propias trampas. Una guía para interpretar los resultados antes de elegir un modelo.</description><pubDate>Sun, 01 Jun 2025 00:00:00 GMT</pubDate><category>investigacion</category><category>benchmarks</category><category>evaluación</category><category>llm</category><category>metodología</category><author>Equipo Blog IA</author></item><item><title>LM Studio: la interfaz gráfica para correr LLMs en local sin tocar la terminal</title><link>https://blog-ia.example.com/blog/lm-studio-interfaz-local/</link><guid isPermaLink="true">https://blog-ia.example.com/blog/lm-studio-interfaz-local/</guid><description>LM Studio ofrece una alternativa a Ollama con interfaz gráfica: descarga modelos desde HuggingFace, los gestiona y expone una API local compatible con OpenAI. Ideal para quien no quiere configurar nada manualmente.</description><pubDate>Wed, 28 May 2025 00:00:00 GMT</pubDate><category>herramientas</category><category>lm-studio</category><category>local-llm</category><category>self-hosted</category><category>herramientas</category><author>Equipo Blog IA</author></item><item><title>Qwen 2.5: Alibaba publica modelos que compiten en multilingüe y código</title><link>https://blog-ia.example.com/blog/qwen-25-alibaba/</link><guid isPermaLink="true">https://blog-ia.example.com/blog/qwen-25-alibaba/</guid><description>La familia Qwen 2.5 de Alibaba incluye variantes especializadas en código y matemáticas, con soporte sobresaliente para idiomas asiáticos y rendimiento competitivo en benchmarks occidentales.</description><pubDate>Tue, 20 May 2025 00:00:00 GMT</pubDate><category>modelos</category><category>alibaba</category><category>qwen</category><category>multilingüe</category><category>open-weights</category><author>Equipo Blog IA</author></item><item><title>Agentes de IA: arquitecturas que funcionan en producción (y las que no)</title><link>https://blog-ia.example.com/blog/ai-agents-arquitecturas/</link><guid isPermaLink="true">https://blog-ia.example.com/blog/ai-agents-arquitecturas/</guid><description>El concepto de agente de IA existe desde hace años, pero las implementaciones prácticas que realmente funcionan son pocas. Repasamos los patrones que están dando resultados y los antipatrones más comunes.</description><pubDate>Thu, 15 May 2025 00:00:00 GMT</pubDate><category>investigacion</category><category>agentes</category><category>arquitectura</category><category>llm</category><category>producción</category><author>Equipo Blog IA</author></item><item><title>Model Context Protocol: el estándar abierto que Anthropic propuso para conectar LLMs con herramientas</title><link>https://blog-ia.example.com/blog/anthropic-mcp-protocol/</link><guid isPermaLink="true">https://blog-ia.example.com/blog/anthropic-mcp-protocol/</guid><description>MCP define cómo los modelos de lenguaje se conectan con fuentes de datos, herramientas externas y sistemas. Anthropic lo publicó como estándar abierto y varios proveedores lo están adoptando.</description><pubDate>Sat, 10 May 2025 00:00:00 GMT</pubDate><category>herramientas</category><category>anthropic</category><category>mcp</category><category>agentes</category><category>integraciones</category><author>Equipo Blog IA</author></item><item><title>OpenAI o1: pensar antes de responder y lo que eso significa para los devs</title><link>https://blog-ia.example.com/blog/openai-o1-reasoning/</link><guid isPermaLink="true">https://blog-ia.example.com/blog/openai-o1-reasoning/</guid><description>o1 es el primer modelo de OpenAI que genera una cadena de razonamiento interna antes de responder. Cambia la relación coste-calidad para problemas complejos y exige replantear cómo se hacen los prompts.</description><pubDate>Thu, 01 May 2025 00:00:00 GMT</pubDate><category>modelos</category><category>openai</category><category>o1</category><category>razonamiento</category><category>prompting</category><author>Equipo Blog IA</author></item><item><title>Modelos multimodales en 2025: qué puede hacer realmente la visión por IA</title><link>https://blog-ia.example.com/blog/multimodal-vision-texto/</link><guid isPermaLink="true">https://blog-ia.example.com/blog/multimodal-vision-texto/</guid><description>Los LLMs con capacidad visual ya no son novedad, pero sus capacidades reales varían mucho. Repasamos qué funciona bien en visión, dónde fallan todavía y las arquitecturas que lo hacen posible.</description><pubDate>Fri, 25 Apr 2025 00:00:00 GMT</pubDate><category>investigacion</category><category>multimodal</category><category>visión</category><category>gpt-4v</category><category>llava</category><author>Equipo Blog IA</author></item><item><title>Claude Computer Use: el modelo que opera interfaces gráficas, con todas sus limitaciones</title><link>https://blog-ia.example.com/blog/claude-computer-use/</link><guid isPermaLink="true">https://blog-ia.example.com/blog/claude-computer-use/</guid><description>Anthropic lanzó en beta la capacidad de Claude para controlar un ordenador mediante capturas de pantalla. Revisamos cómo funciona, para qué sirve hoy y por qué todavía no reemplaza la automatización tradicional.</description><pubDate>Tue, 22 Apr 2025 00:00:00 GMT</pubDate><category>herramientas</category><category>anthropic</category><category>claude</category><category>computer-use</category><category>automatización</category><author>Equipo Blog IA</author></item><item><title>Phi-3 de Microsoft: cuando un modelo pequeño hace el trabajo de uno grande</title><link>https://blog-ia.example.com/blog/microsoft-phi-3/</link><guid isPermaLink="true">https://blog-ia.example.com/blog/microsoft-phi-3/</guid><description>Microsoft publicó Phi-3 Mini con 3.8B parámetros y rendimiento de modelo mediano. El experimento demuestra que la calidad de los datos de entrenamiento puede compensar el tamaño del modelo.</description><pubDate>Tue, 15 Apr 2025 00:00:00 GMT</pubDate><category>modelos</category><category>microsoft</category><category>phi-3</category><category>small-models</category><category>eficiencia</category><author>Equipo Blog IA</author></item><item><title>Groq: inferencia a 500 tokens por segundo y lo que cambia cuando el modelo va rápido</title><link>https://blog-ia.example.com/blog/groq-inferencia-rapida/</link><guid isPermaLink="true">https://blog-ia.example.com/blog/groq-inferencia-rapida/</guid><description>Groq usa chips LPU propios en lugar de GPUs para inferencia de LLMs. El resultado: velocidades que hacen que la generación de texto parezca instantánea. Revisamos cuándo esto importa y cuándo no.</description><pubDate>Tue, 08 Apr 2025 00:00:00 GMT</pubDate><category>herramientas</category><category>groq</category><category>inferencia</category><category>velocidad</category><category>api</category><author>Equipo Blog IA</author></item><item><title>Gemma 2: los modelos ligeros de Google que corren en tu laptop</title><link>https://blog-ia.example.com/blog/google-gemma-2/</link><guid isPermaLink="true">https://blog-ia.example.com/blog/google-gemma-2/</guid><description>Google publicó Gemma 2 con variantes de 2B, 9B y 27B parámetros. El modelo de 9B supera a Llama 3 8B en benchmarks clave y corre en consumer hardware sin grandes concesiones.</description><pubDate>Wed, 02 Apr 2025 00:00:00 GMT</pubDate><category>modelos</category><category>google</category><category>gemma</category><category>on-device</category><category>open-weights</category><author>Equipo Blog IA</author></item><item><title>GitHub Models: probar LLMs directamente desde tu repositorio</title><link>https://blog-ia.example.com/blog/github-models-marketplace/</link><guid isPermaLink="true">https://blog-ia.example.com/blog/github-models-marketplace/</guid><description>GitHub integró un marketplace de modelos donde puedes experimentar con GPT-4o, Llama 3 y otros directamente desde github.com, con créditos gratuitos para desarrollo y una API unificada.</description><pubDate>Tue, 25 Mar 2025 00:00:00 GMT</pubDate><category>herramientas</category><category>github</category><category>modelos</category><category>api</category><category>developer-tools</category><author>Equipo Blog IA</author></item><item><title>Embeddings en 2025: qué modelo de vectores elegir para tu aplicación</title><link>https://blog-ia.example.com/blog/embeddings-comparativa/</link><guid isPermaLink="true">https://blog-ia.example.com/blog/embeddings-comparativa/</guid><description>text-embedding-3-large de OpenAI, Cohere Embed v3, y los modelos de HuggingFace como BGE o E5 tienen rendimiento y costes muy distintos. Guía práctica para elegir según el caso de uso.</description><pubDate>Thu, 20 Mar 2025 00:00:00 GMT</pubDate><category>investigacion</category><category>embeddings</category><category>vector-search</category><category>openai</category><category>rag</category><author>Equipo Blog IA</author></item><item><title>DeepSeek R1: el modelo chino que igualó a o1 a una fracción del coste</title><link>https://blog-ia.example.com/blog/deepseek-r1-razonamiento/</link><guid isPermaLink="true">https://blog-ia.example.com/blog/deepseek-r1-razonamiento/</guid><description>DeepSeek publicó R1 con pesos abiertos y rendimiento equivalente a OpenAI o1 en matemáticas y código. El impacto en el mercado fue inmediato y la discusión sobre eficiencia en el entrenamiento se reabrió.</description><pubDate>Tue, 18 Mar 2025 00:00:00 GMT</pubDate><category>modelos</category><category>deepseek</category><category>razonamiento</category><category>open-source</category><category>china</category><author>Equipo Blog IA</author></item><item><title>Vercel AI SDK: la capa de abstracción que hace sensato trabajar con múltiples LLMs</title><link>https://blog-ia.example.com/blog/vercel-ai-sdk/</link><guid isPermaLink="true">https://blog-ia.example.com/blog/vercel-ai-sdk/</guid><description>El AI SDK de Vercel unifica la interfaz para OpenAI, Anthropic, Google y otros proveedores. Streaming, generación de objetos estructurados y herramientas con una API consistente.</description><pubDate>Mon, 10 Mar 2025 00:00:00 GMT</pubDate><category>herramientas</category><category>vercel</category><category>ai-sdk</category><category>typescript</category><category>next.js</category><author>Equipo Blog IA</author></item><item><title>Mistral Large 2: el modelo europeo que no pide disculpas por competir con los grandes</title><link>https://blog-ia.example.com/blog/mistral-large-2/</link><guid isPermaLink="true">https://blog-ia.example.com/blog/mistral-large-2/</guid><description>Mistral AI lanzó Large 2 con 123B parámetros, ventana de 128K tokens y rendimiento que rivaliza con GPT-4o. Disponible como pesos descargables y como API, con enfoque en idiomas europeos.</description><pubDate>Wed, 05 Mar 2025 00:00:00 GMT</pubDate><category>modelos</category><category>mistral</category><category>europa</category><category>llm</category><category>open-weights</category><author>Equipo Blog IA</author></item><item><title>Mixture of Experts: por qué Mixtral y GPT-4 son más eficientes de lo que parecen</title><link>https://blog-ia.example.com/blog/mixture-of-experts/</link><guid isPermaLink="true">https://blog-ia.example.com/blog/mixture-of-experts/</guid><description>La arquitectura MoE activa solo una fracción de los parámetros del modelo en cada inferencia. Eso permite modelos enormes que cuestan como modelos pequeños. Explicamos el mecanismo y sus implicaciones.</description><pubDate>Sun, 02 Mar 2025 00:00:00 GMT</pubDate><category>investigacion</category><category>moe</category><category>arquitectura</category><category>mixtral</category><category>eficiencia</category><author>Equipo Blog IA</author></item><item><title>Ollama: ejecutar LLMs en local con un solo comando</title><link>https://blog-ia.example.com/blog/ollama-llms-local/</link><guid isPermaLink="true">https://blog-ia.example.com/blog/ollama-llms-local/</guid><description>Ollama simplifica radicalmente correr modelos de lenguaje en tu propia máquina. Un repaso de cómo funciona, qué modelos soporta y cuándo tiene sentido frente a usar una API en la nube.</description><pubDate>Tue, 25 Feb 2025 00:00:00 GMT</pubDate><category>herramientas</category><category>ollama</category><category>local-llm</category><category>self-hosted</category><category>privacidad</category><author>Equipo Blog IA</author></item><item><title>Llama 3: Meta apuesta fuerte por el open source y pone presión a los modelos propietarios</title><link>https://blog-ia.example.com/blog/llama-3-meta-open-source/</link><guid isPermaLink="true">https://blog-ia.example.com/blog/llama-3-meta-open-source/</guid><description>Meta publicó Llama 3 con pesos descargables, contexto de 128K tokens y rendimiento competitivo con GPT-4. El ecosistema open source no había visto algo así desde el primer Llama.</description><pubDate>Thu, 20 Feb 2025 00:00:00 GMT</pubDate><category>modelos</category><category>meta</category><category>llama</category><category>open-source</category><category>self-hosted</category><author>Equipo Blog IA</author></item><item><title>Constitutional AI: cómo Anthropic entrena modelos para alinearse con principios sin feedback humano exhaustivo</title><link>https://blog-ia.example.com/blog/constitutional-ai/</link><guid isPermaLink="true">https://blog-ia.example.com/blog/constitutional-ai/</guid><description>CAI es la técnica de Anthropic para reducir comportamientos dañinos usando al propio modelo como crítico. Explicamos el mecanismo y por qué importa para quienes construyen aplicaciones con LLMs.</description><pubDate>Tue, 18 Feb 2025 00:00:00 GMT</pubDate><category>investigacion</category><category>anthropic</category><category>alineamiento</category><category>constitutional-ai</category><category>seguridad</category><author>Equipo Blog IA</author></item><item><title>Gemini 1.5 Pro y la ventana de contexto de 1 millón de tokens</title><link>https://blog-ia.example.com/blog/gemini-15-pro-ventana-contexto/</link><guid isPermaLink="true">https://blog-ia.example.com/blog/gemini-15-pro-ventana-contexto/</guid><description>Google amplió el contexto de Gemini 1.5 Pro a 1 millón de tokens y, en versión experimental, a 2 millones. Qué cambia cuando puedes meter un codebase entero en el prompt.</description><pubDate>Mon, 10 Feb 2025 00:00:00 GMT</pubDate><category>modelos</category><category>google</category><category>gemini</category><category>context-window</category><category>multimodal</category><author>Equipo Blog IA</author></item><item><title>Cursor: el editor que convirtió la IA en parte del entorno de desarrollo</title><link>https://blog-ia.example.com/blog/cursor-ai-editor/</link><guid isPermaLink="true">https://blog-ia.example.com/blog/cursor-ai-editor/</guid><description>Cursor es un fork de VS Code con integración nativa de LLMs. Más que un plugin, cambia el modelo mental de cómo interactuar con el código. Repasamos qué lo diferencia de GitHub Copilot y cuándo merece el cambio.</description><pubDate>Wed, 05 Feb 2025 00:00:00 GMT</pubDate><category>herramientas</category><category>cursor</category><category>ide</category><category>developer-tools</category><category>productividad</category><author>Equipo Blog IA</author></item><item><title>LoRA y QLoRA: cómo hacer fine-tuning de LLMs sin necesitar un datacenter</title><link>https://blog-ia.example.com/blog/lora-fine-tuning/</link><guid isPermaLink="true">https://blog-ia.example.com/blog/lora-fine-tuning/</guid><description>Low-Rank Adaptation permite adaptar modelos grandes a dominios específicos entrenando menos del 1% de sus parámetros. Con QLoRA, cabe en una sola GPU de consumo. Aquí el estado del arte práctico.</description><pubDate>Sat, 01 Feb 2025 00:00:00 GMT</pubDate><category>investigacion</category><category>fine-tuning</category><category>lora</category><category>qlora</category><category>entrenamiento</category><author>Equipo Blog IA</author></item><item><title>GPT-4o: multimodal nativo y el fin de los modelos separados de OpenAI</title><link>https://blog-ia.example.com/blog/gpt-4o-todo-lo-que-necesitas-saber/</link><guid isPermaLink="true">https://blog-ia.example.com/blog/gpt-4o-todo-lo-que-necesitas-saber/</guid><description>OpenAI fusionó texto, audio e imagen en un solo modelo con GPT-4o. Repaso de qué significa esto para el desarrollo de aplicaciones y dónde sigue siendo la mejor opción.</description><pubDate>Tue, 28 Jan 2025 00:00:00 GMT</pubDate><category>modelos</category><category>openai</category><category>gpt-4o</category><category>multimodal</category><category>api</category><author>Equipo Blog IA</author></item><item><title>GitHub Copilot Workspace: el salto de completado de código a agente de tareas</title><link>https://blog-ia.example.com/blog/github-copilot-workspace/</link><guid isPermaLink="true">https://blog-ia.example.com/blog/github-copilot-workspace/</guid><description>GitHub presentó Copilot Workspace como el siguiente paso después del autocompletado: un entorno donde describes una tarea en lenguaje natural y el modelo propone, explica y ejecuta los cambios en tu repositorio.</description><pubDate>Mon, 20 Jan 2025 00:00:00 GMT</pubDate><category>herramientas</category><category>github</category><category>copilot</category><category>agentes</category><category>developer-tools</category><author>Equipo Blog IA</author></item><item><title>Claude 3.5 Sonnet: el modelo que cambió la vara de los benchmarks</title><link>https://blog-ia.example.com/blog/claude-35-sonnet-analisis/</link><guid isPermaLink="true">https://blog-ia.example.com/blog/claude-35-sonnet-analisis/</guid><description>Anthropic lanzó Claude 3.5 Sonnet y superó a GPT-4o en la mayoría de pruebas de razonamiento y código. Qué cambia para los desarrolladores y qué limitaciones sigue teniendo.</description><pubDate>Wed, 15 Jan 2025 00:00:00 GMT</pubDate><category>modelos</category><category>claude</category><category>anthropic</category><category>benchmarks</category><category>llm</category><author>Equipo Blog IA</author></item><item><title>RAG en 2025: más allá del vector search básico</title><link>https://blog-ia.example.com/blog/rag-tecnicas-avanzadas/</link><guid isPermaLink="true">https://blog-ia.example.com/blog/rag-tecnicas-avanzadas/</guid><description>La recuperación aumentada evolucionó. RAG híbrido, reranking, chunking inteligente y grafos de conocimiento son técnicas que marcan la diferencia entre un RAG que funciona y uno que falla en producción.</description><pubDate>Sun, 12 Jan 2025 00:00:00 GMT</pubDate><category>investigacion</category><category>rag</category><category>vector-search</category><category>arquitectura</category><category>embeddings</category><author>Equipo Blog IA</author></item></channel></rss>