Mugen AI S.L.U. — Hoja de ruta 2026

Ejercito de agentes IA

9 proyectos. Stack real. Paso a paso, desde las trincheras. Primero supervisamos, luego delegamos.

01 — Proyectos Los 9 agentes

Total

En produccion

Por construir

Coste estimado

~280 EUR

Fase 1 — Cimientos

01 Elio — Agente de voz en produccion Retell AI + N8N + Cal.com + netelip v179 +

Agente de voz entrante para netelip. Cualifica contactos, agenda citas con Cal.com, transfiere llamadas. Post-call analysis con Gemini 2.5 Flash. 70+ palabras en diccionario de pronunciacion. Webhook a N8N Cloud para procesamiento.

Voz

ElevenLabs turbo v2.5 (custom voice)

LLM

Gemini 2.0 Flash via Retell LLM

Telefonia

netelip SIP trunk

Orquestacion

N8N Cloud (webhook post-call)

Agenda

Cal.com (reserva citas)

Coste

~120 EUR/mes (todo incluido)

02 RAG — Cerebro de Mili Base conocimiento telefonia IP prioritario +

Base de conocimiento centralizada con toda la informacion de telefonia IP: tecnica, funcional y marketing. El cerebro que alimenta GPTs, chatbot web, WhatsApp y email. Una sola base, multiples salidas.

Contenido

Docs netelip + precios + guias tecnicas

Vectores

Por definir (Pinecone / Supabase / Qdrant)

LLM

Claude o GPT-4o (por evaluar)

Salidas

GPT, chatbot web, WhatsApp, email

03 Demo — 3 agentes de voz Retell AI multi-agente mejorar +

Demo espectacular con 3 agentes interactuando: transferencias, agendado de citas, empatia. Muestra la potencia real de un sistema de voz IA. Automatizar post-call con WhatsApp o email en vez de pedir datos por voz.

Agentes

3 agentes Retell AI coordinados

Post-call

Automatizar envio WA / email

Objetivo

Vender el servicio de agentes de voz

Fase 2 — Escalar

04 Agente de contenido — Voz de Mili Claude + SPECs + SKILLs nuevo +

Agente que conoce tu voz, tus SPECs (identidad visual, voz y tono, formato LinkedIn) y tus SKILLs (generar carruseles, articulos). Redacta posts, articulos de blog, carruseles con tu tono real. Ya lo estamos haciendo aqui.

Motor

Claude con proyecto personalizado

Contexto

SPEC-01 a 04 + SKILL-01

Salidas

Blog, LinkedIn, carruseles PDF

05 GPTs especializados OpenAI GPTs + base de datos nuevo +

GPTs con buenas bases de conocimiento y prompts potentes. Consultor 360 de telefonia IP con precios en tiempo real, asistente tecnico netelip, generador de presupuestos. Alimentados por el RAG (proyecto 02).

Plataforma

OpenAI GPTs con Actions

Base datos

RAG cerebro de Mili (P02)

Coste

~20 EUR/mes (ChatGPT Plus)

06 Widget de llamada web Retell SDK + JS frontend nuevo +

Boton en tu web (o la de un cliente) que al hacer clic conecta con Elio. El visitante habla con el agente sin salir de la pagina. Widget con los colores de marca que cambia segun si el agente escucha o habla.

SDK

Retell Web SDK (client_key)

Frontend

Vanilla JS o React

Deploy

miliperez.com via Netlify/Vercel

Fase 3 — Expandir

07 Instagram + avatares IA Workflow creacion video IA nuevo +

Cuenta Instagram para vender servicios de Mugen AI. Avatares IA, reels automatizados, contenido con tu clon digital. Referencia: Miriam Lao. Workflow profesional de creacion de video con IA.

Imagenes

Midjourney / Flux / Ideogram

Video

Runway ML / Kling / Hailuo

Lip Sync

HeyGen / Runway Act 2

Voz

ElevenLabs (clon de tu voz)

Escalado

Topaz / Krea / Magnific

Grabacion

Loom (pantalla + cam flotante)

08 WhatsApp IA — Clon de Mili API por definir + N8N + LLM nuevo +

Tu gemelo digital en WhatsApp. Habla como tu, responde como tu, usa tus expresiones. Stack por definir: Meta API oficial (compatible con N8N Cloud) vs Evolution API (requiere self-hosted) vs WAHA.

Opcion A

Meta Business API (funciona N8N Cloud)

Opcion B

Evolution API (requiere VPS + Docker)

Opcion C

WAHA (REST API + webhook)

LLM

Claude API (tu voz) + Gemini (fallback)

09 Dashboard de monitorizacion N8N + Google Sheets / Looker nuevo +

Panel centralizado con todo lo que pasa: llamadas de Elio, mensajes del chatbot, leads, citas agendadas, metricas de contenido. Todo en un sitio para supervisar el ejercito antes de delegar.

Datos

N8N webhooks de todos los agentes

Almacen

Google Sheets o Supabase

Visualizacion

Looker Studio o HTML custom

02 — Stack Herramientas

Voz

Retell AI

Plataforma de agentes de voz. Elio corre aqui. Latencia sub-segundo.

Activo

Voz

ElevenLabs

Voz custom turbo v2.5 para Elio. Clon de voz para contenido.

Activo

Telefonia

netelip

SIP trunk. Telefonia IP. 14 anos de experiencia.

Activo

Automatizacion

N8N Cloud

Orquestador central. Webhooks, flujos, conexiones entre agentes.

Activo

LLM

Claude

Contenido, SPECs, articulos, carruseles. Tu voz en texto.

Activo

LLM

Gemini 2.0 Flash

LLM de Elio en produccion. Rapido y barato para voz.

Activo

LLM

ChatGPT / GPTs

GPTs especializados con Actions y base de conocimiento.

Planificado

Agenda

Cal.com

Reserva de citas desde Elio. Plan gratuito.

Activo

CRM

HubSpot

Seguimiento de leads y oportunidades. Plan gratuito.

Planificado

Web

Netlify / Vercel

Deploy de miliperez.com y widgets. GitHub integration.

Activo

Imagen

Midjourney

Generacion de imagenes IA. Arte conceptual y visual.

Aprendiendo

Imagen

Flux / Ideogram

Alternativas de imagen IA. Texto en imagenes.

Aprendiendo

Edicion

Photoshop / Canva

Edicion de imagenes. Generative Fill. Inpainting.

Planificado

Escalado

Topaz / Krea / Magnific

Upscaling de imagenes y video con IA.

Aprendiendo

Video

Runway ML

Generacion de video IA. Inpainting. Super slow motion.

Aprendiendo

Video

Google VEO 3.1 / Kling

Modelos de video IA de ultima generacion.

Aprendiendo

Lip Sync

HeyGen / D-ID

Avatares IA con movimiento labial sincronizado.

Aprendiendo

Grabacion

Loom

Grabacion de pantalla con camara flotante. Tutoriales y demos.

Planificado

Musica

Suno / Soundful

Creacion de musica con IA para reels y videos.

Aprendiendo

Subtitulos

Veed / Submagic

Subtitulos automaticos para reels y videos.

Planificado

03 — Workflow Creacion de contenido con IA

Workflow completo de creacion de contenido con IA adaptado al stack de Mili Perez.

Generar la idea

ChatGPT / Claude / Gemini

Crear el guion

Claude (con SPEC-02 voz de Mili) / ChatGPT

Refinar el guion

Claude / Google Docs / Notion AI

Crear lista de planos (shot list)

Claude / Google Sheets

Crear arte de imagenes

Midjourney / Flux / Ideogram / DALL-E / Adobe Firefly

Crear voz en off (voice over)

ElevenLabs (clon de tu voz) / Lovo

Editar animatic basico

Descript / Runway / DaVinci Resolve

Anadir musica

Suno / Soundful / Soundraw

Escalar imagenes del proyecto

Krea / Magnific / Topaz Gigapixel AI

Crear movimientos labiales (lip sync)

HeyGen / Runway Lipsync / D-ID

Eliminar marcas de agua

Canva / Photoshop Generative Fill

Preparar activos para animacion

Canva / Clipdrop / Runway

Crear movimientos cinematicos

After Effects / LeiaPix / Runway

Compilar proyecto final

DaVinci Resolve / CapCut / Premiere Pro

Escalar y suavizar video

Topaz Video AI / Runway Super Slow Motion

Anadir subtitulos

Veed / Submagic

Crear descripcion y etiquetas

Claude (SPEC-02 voz Mili) / ChatGPT

Distribuir en linea

Instagram / LinkedIn / YouTube / TikTok

04 — Arquitectura Diagrama del sistema

Capa 1 — Canales de entrada

Voz

Elio + netelip

Por definir API

Web chat

Chatbot RAG

Gmail + N8N

↓ ↓ ↓ ↓

N8N — Router central

Clasifica, enruta, orquesta

↓ ↓ ↓

Cliente existente

Transferir / soporte

Lead nuevo

Cualificar / agendar

Consulta tecnica

RAG / GPT responde

Capa 2 — Cerebro central (RAG)

Base de conocimiento

Telefonia IP + marketing + tecnico + precios netelip

Alimenta a

GPTs

Alimenta a

Chatbot web

Alimenta a

WhatsApp IA

Alimenta a

Email IA

Alimenta a

Elio (voz)

Capa 3 — Pipeline de contenido

LLM

Claude
ChatGPT
Gemini

Imagen

Midjourney
Flux
Ideogram

Edicion

Photoshop
Canva
Krea

Video

Runway ML
VEO 3.1
Kling

Escalado

Topaz
Magnific
Krea

Sonido

ElevenLabs
Suno
Soundful

Lip Sync

HeyGen
D-ID
Runway Act 2

05 — Flujos Diagramas de flujo

Flujo de cada proceso clave. Asi funciona cada pieza del ejercito por dentro.

Flujo 1 — Llamada entrante (Elio)

Cliente llama al numero netelip

SIP trunk recibe la llamada

Retell AI conecta con Elio

Saludo personalizado, deteccion de idioma

Elio pregunta: eres cliente?

Cualificacion del contacto

Si — Cliente

Transferir al departamento correspondiente

No — Lead nuevo

Continuar cualificacion

Capturar nombre, email, telefono

Deletreo de email, confirmacion verbal

N8N comprueba disponibilidad en Cal.com

Webhook consulta horarios libres

Elio ofrece horarios al contacto

Transforma en formato natural (manana a las 10)

Reserva la cita en Cal.com

Confirmacion verbal al contacto

Post-call: Gemini analiza la llamada

Resumen, datos capturados, cita_reservada: true/false

N8N procesa el reporte

Webhook post-call envia datos al equipo

Flujo 2 — Consulta WhatsApp IA

Cliente escribe por WhatsApp

Mensaje entrante via API

N8N recibe el webhook

Clasifica tipo de mensaje (texto, audio, imagen)

Tipo de consulta?

Clasificacion por intencion

Telefonia IP

RAG responde con base de conocimiento

Comercial / cita

Escala a Mili o agenda automaticamente

LLM genera respuesta con voz de Mili

Claude API + contexto RAG + tono SPEC-02

Envia respuesta por WhatsApp

Texto natural, sin parecer bot

Flujo 3 — Creacion de contenido Instagram

Definir tema y objetivo del reel

Claude genera idea + guion con SPEC-02

Crear shot list y storyboard

Lista de planos con prompts para cada imagen

Generar imagenes con IA

Midjourney / Flux / Ideogram

Crear voice over con ElevenLabs

Clon de voz de Mili leyendo el guion

Generar video / lip sync

HeyGen o Runway para avatar animado

Editar y compilar

CapCut / DaVinci + musica (Suno) + subtitulos (Veed)

Escalar y pulir

Topaz / Magnific para calidad final

Publicar + descripcion + hashtags

Claude genera copy con SPEC-02

Flujo 4 — RAG: consulta a la base de conocimiento

Pregunta llega por cualquier canal

Voz / WhatsApp / web chat / email / GPT

Convertir pregunta en embedding

Modelo de embeddings vectoriza la consulta

Buscar en base de datos vectorial

Pinecone / Supabase / Qdrant — similaridad coseno

Recuperar fragmentos relevantes

Top 3-5 chunks mas similares a la pregunta

LLM genera respuesta con contexto

Claude / GPT-4o + fragmentos + prompt de sistema

Respuesta al canal de origen

Formateada segun el canal (voz breve, texto detallado)

06 — Mapas Mapas mentales

Vision global de cada area. Para ver de un vistazo como se conecta todo.

Mugen AI — Ejercito de agentes

Agentes de voz

Elio produccion (v179)

Demo 3 agentes (mejorar)

Widget llamada web SDK

Agente empatico avanzado

Agentes de texto

WhatsApp IA clon Mili

Chatbot web RAG

Email IA automatizado

GPTs especializados

Contenido

Blog miliperez.com (Claude + SPECs)

Carruseles LinkedIn (SKILL-01)

Instagram + avatares IA

Reels con clon de voz

Stack tecnologico por capa

Capa 1: Canales

Telefono (netelip SIP)

WhatsApp (API por definir)

Web chat (chatbot RAG)

Email (Gmail + N8N)

Instagram DM (API Meta)

Capa 2: Cerebro

RAG base conocimiento

Vectores (Pinecone/Supabase)

LLM voz: Gemini 2.0 Flash

LLM texto: Claude

LLM GPTs: OpenAI

Capa 3: Orquestacion

N8N Cloud (webhooks)

Cal.com (agenda)

HubSpot CRM (leads)

Dashboard monitor

Pipeline de contenido IA

Texto y guion

Claude (voz de Mili, SPECs)

ChatGPT (ideas, brainstorm)

Gemini (alternativa rapida)

Visual

Midjourney (arte conceptual)

Flux / Ideogram (texto en imagen)

Photoshop / Canva (edicion)

Topaz / Magnific (escalado)

Video y audio

Runway ML / VEO 3.1 (generacion)

ElevenLabs (clon de voz)

HeyGen / D-ID (lip sync avatar)

Suno (musica IA)

Loom (grabacion pantalla)

Distribucion

LinkedIn (posts + carruseles)

Blog miliperez.com

Instagram (nueva cuenta)

YouTube (futuro)

Veed / Submagic (subtitulos)

Hoja de ruta temporal

Semanas 1-3

Elio v179 estable

Montar RAG cerebro de Mili

Mejorar demo 3 agentes

Definir API WhatsApp

Semanas 3-6

Agente contenido operativo

GPTs con base precios

Widget llamada en web

WhatsApp IA v1

Semanas 6-10

Cuenta Instagram activa

Primeros reels con avatar

Dashboard monitorizacion

Evaluar orquestador

07 — Costes Desglose por proyecto

Proyecto	Herramientas	Fijo/mes	Variable	Total est.
01 Elio produccion	Retell + ElevenLabs + netelip	0 EUR	~0.11-0.15 EUR/min	~120 EUR
02 RAG cerebro Mili	Vectores + LLM API	0-25 EUR	~0.01 EUR/consulta	~25 EUR
03 Demo 3 agentes	Retell (compartido con P01)	0 EUR	Incluido en P01	0 EUR
04 Agente contenido	Claude Pro	20 EUR	—	20 EUR
05 GPTs especializados	ChatGPT Plus	20 EUR	—	20 EUR
06 Widget llamada web	Retell SDK (compartido con P01)	0 EUR	Incluido en P01	0 EUR
07 Instagram + avatares	Midjourney + HeyGen + Suno	~40 EUR	Variable por uso	~50 EUR
08 WhatsApp IA	API WA + LLM + VPS?	0-10 EUR	~0.01-0.05 EUR/msg	~20 EUR
09 Dashboard	Google Sheets/Looker (gratis)	0 EUR	—	0 EUR
N8N Cloud (compartido)		24 EUR	—	24 EUR
Total mensual estimado				~279 EUR

Proyectos 03 y 06 comparten infraestructura con Elio (P01). Cal.com y HubSpot tienen plan gratuito.

08 — Dependencias Que necesita cada proyecto

No puedes construir todo en paralelo. Algunas piezas dependen de otras. Este mapa te dice en que orden ir.

P01 Elio produccion

Sin dependencias — ya en produccion

P02 RAG cerebro

Documentacion de netelip recopilada

Base de precios actualizada

Decidir base vectorial

P03 Demo 3 agentes

P01 Elio estable (hecho)

Definir los 3 roles de la demo

P04 Agente contenido

SPECs y SKILLs actualizados (hecho)

Ya operativo en Claude

P05 GPTs especializados

P02 RAG montado (bloqueante)

Base de precios en formato consultable

P06 Widget llamada web

P01 Elio estable (hecho)

Codigo frontend (JS/React)

P07 Instagram + avatares

Workflow de video IA dominado

Clon de voz en ElevenLabs

Cuenta Instagram creada

P08 WhatsApp IA

P02 RAG montado (bloqueante)

API WhatsApp decidida (bloqueante)

Entrenamiento con tu voz (textos)

P09 Dashboard

P01 Elio con webhooks (hecho)

Al menos 2 agentes activos

Definir metricas clave

Las lineas rojas son bloqueantes: no puedes empezar ese proyecto sin resolver la dependencia.

09 — Tareas Checklist por proyecto

Haz clic en cualquier tarea para marcarla como hecha. Tu lista de accion concreta.

P01 Elio produccion completado

Crear agente en Retell AI
Configurar voz custom ElevenLabs
Conectar SIP trunk netelip
Montar flujo N8N para Cal.com
Configurar post-call analysis Gemini
Diccionario pronunciacion (70+ palabras)
Probar en produccion real

P02 RAG cerebro de Mili prioritario

Recopilar toda la documentacion netelip
Estructurar base de precios (productos, planes, paises)
Recopilar guias tecnicas (SIP, VoIP, configuraciones)
Recopilar contenido marketing (casos de uso, beneficios)
Elegir base vectorial (Pinecone vs Supabase vs Qdrant)
Chunking y embedding de documentos
Configurar LLM con prompt de sistema
Probar con 20 preguntas reales
Conectar con N8N como API interna

P03 Demo 3 agentes mejorar

Definir los 3 roles de la demo
Revisar y mejorar prompts de cada agente
Configurar transferencias entre agentes
Automatizar post-call con WA o email
Grabar demo completa con Loom
Preparar landing/deck para mostrar demo

P04 Agente contenido Mili en progreso

Crear proyecto Claude con SPECs
Subir SPEC-01 a 04 y SKILL-01
Validar voz y tono con articulos reales
Crear SKILL para generacion de posts LinkedIn
Crear SKILL para newsletters
Documentar workflow de publicacion

P05 GPTs especializados pendiente

Esperar a que P02 RAG este listo
Crear GPT consultor telefonia IP
Conectar Actions con base de precios
Crear GPT soporte tecnico netelip
Crear GPT generador de presupuestos
Probar con consultas reales de clientes

P06 Widget llamada web pendiente

Obtener client_key de Retell SDK
Disenar boton flotante con colores marca
Implementar stream de audio bidireccional
Cambio de color segun estado (escucha/habla)
Integrar en miliperez.com
Probar en movil y desktop

P07 Instagram + avatares IA pendiente

Dominar workflow de creacion de video con IA
Crear cuenta Instagram Mili Perez / Mugen AI
Clonar voz en ElevenLabs para contenido
Crear primer avatar IA con HeyGen
Producir 3 reels de prueba
Definir calendario de publicacion
Automatizar pipeline con N8N

P08 WhatsApp IA pendiente

Decidir API: Meta oficial vs Evolution vs WAHA
Esperar a P02 RAG cerebro
Configurar API elegida + webhook N8N
Entrenar LLM con voz de Mili (50 textos ejemplo)
Clasificador de intenciones (tecnico, comercial, soporte)
Probar con 20 conversaciones simuladas
Lanzar en beta con contactos de confianza

P09 Dashboard pendiente

Definir metricas clave por agente
Configurar webhooks de todos los agentes a sheets
Montar dashboard en Looker Studio o HTML
Alertas automaticas por N8N (lead caliente, error)
Vista movil para monitorizar desde el telefono

10 — Riesgos Decisiones pendientes

Lo que puede bloquear o retrasar el proyecto si no se resuelve a tiempo.

Decisiones por tomar

API de WhatsApp: Meta oficial vs Evolution API vs WAHA

Meta funciona con N8N Cloud pero requiere verificacion de empresa. Evolution es gratis pero necesita VPS y no funciona con N8N Cloud. WAHA funciona via webhook pero tiene menos comunidad.

Impacto: medio — Bloquea P08

Base vectorial para el RAG: Pinecone vs Supabase vs Qdrant

Pinecone es el mas maduro pero de pago. Supabase tiene pgvector y ya lo conoces. Qdrant es open source y potente. La eleccion afecta coste y complejidad.

Impacto: alto — Bloquea P02, P05, P08

Migrar N8N a self-hosted o quedarse en Cloud

Cloud es mas facil (24 EUR/mes, sin mantenimiento). Self-hosted es mas barato y permite Evolution API, pero necesitas VPS y saber de Docker. Afecta a todo el stack.

Impacto: medio — Afecta P08 y costes generales

Upgrade Elio a ElevenLabs v3 conversational

Elio usa eleven_turbo_v2_5. Los audio tags de ElevenLabs necesitan eleven_v3_conversational. Migrar habilita expresividad pero requiere validar estabilidad.

Impacto: bajo — Mejora, no bloquea

Riesgos tecnicos

Evolution API inestable con Chromium

WhatsApp cambia el protocolo web frecuentemente. Chromium consume mucha RAM. Si se cae, el bot de WhatsApp deja de funcionar hasta reiniciar manualmente.

Impacto: alto — Si eliges Evolution API

Restricciones de Meta para bots IA en WhatsApp

Desde enero 2026 Meta prohibe chatbots IA de proposito general en WhatsApp. Tu bot necesita un proposito claro (asesora de telefonia IP) para cumplir la normativa.

Impacto: medio — Requiere definir bien el scope del bot

Alucinaciones del RAG con datos de precios

Si la base de conocimiento no esta bien estructurada, el LLM puede inventar precios o mezclar productos. Critico para netelip: un precio mal dado puede perder un cliente.

Impacto: alto — Requiere testing exhaustivo de P02

Coste de video IA para Instagram escalando

Midjourney + HeyGen + Runway pueden sumar rapido si produces mucho contenido. Necesitas definir un presupuesto mensual cerrado para contenido visual.

Impacto: medio — Controlar con presupuesto fijo

11 — KPIs Metricas de exito

Como sabes que cada agente funciona bien. Sin metricas no hay mejora.

P01 Elio (voz)

Tasa de citas agendadas> 30%

Llamadas completadas sin corte> 85%

Hallucinations detectadas0%

Duracion media de llamada2-4 min

Satisfaccion post-call> 4/5

P02 RAG cerebro

Precision de respuesta> 90%

Precios correctos100%

Tiempo de respuesta< 3s

Consultas sin respuesta< 5%

P03 Demo 3 agentes

Transferencias exitosas> 95%

Demos que generan lead> 40%

Tiempo total de la demo< 5 min

P04 Agente contenido

Articulos publicados / mes> 4

Posts LinkedIn / semana2-3

Reescrituras necesarias< 20%

Engagement LinkedIn> 3%

P07 Instagram

Reels publicados / semana3-5

Seguidores primer mes> 500

Leads desde Instagram> 5 / mes

Coste por reel producido< 5 EUR

P08 WhatsApp IA

Respuestas automaticas / total> 70%

Escalaciones a Mili real< 30%

Tiempo de respuesta< 10s

"Suena a Mili" (test ciego)> 80%

12 — RAG Evaluacion de opciones

Comparativa de bases vectoriales y plataformas RAG para decidir donde montar el cerebro de Mili. Dos mundos: Creadora de IA + Telefonia IP.

Estructura del RAG — Dos mundos

Mundo 1 — Creadora de IA

Agentes de voz con IA (Elio, arquitecturas)
Stack: Retell AI, ElevenLabs, N8N, Cal.com
Prompts, configuraciones, buenas practicas
Articulos de miliperez.com
Aprendizajes y errores en produccion

Mundo 2 — Telefonia IP

Productos y precios netelip
Configuraciones SIP, WebRTC, VoIP
Centralitas virtuales, integraciones CRM
Guias tecnicas para clientes
Marketing: casos de uso, beneficios

Comparativa bases vectoriales

	Supabase pgvector	Qdrant	Pinecone	Google Vertex RAG	ChromaDB
Nivel tecnico	Bajo	Medio	Bajo	Alto (Python, GCP)	Bajo
Coste mensual	0 EUR (free tier)	30-50 EUR (VPS)	0-70 USD	5-50 USD	0-15 EUR (VPS)
Precision RAG	Buena	Muy buena	Muy buena	Excelente (90-97%)	Buena
Filtrado avanzado	SQL (basico)	El mejor del mercado	Bueno	Muy bueno	Basico
Busqueda hibrida	No nativa	Si	Si	Si	No
Multi-modelo LLM	Tu eliges	Tu eliges	Tu eliges	Solo Gemini	Tu eliges
Chatbot incluido	No	No	No	No	No
API para N8N	Si (REST)	Si (REST)	Si	Si	Si
Escalabilidad	Media (<3M vec)	Alta	Alta	Maxima	Baja (<5M vec)
Free tier	500 MB	1 GB cloud	2 GB	300 USD creditos	Gratis (self-host)
Open source	Si	Si (Apache 2.0)	No	No	Si (Apache 2.0)
Ideal para	Mili sola	Netelip + devs	Prototipo rapido	Netelip + devs	Prototipo local

Plataformas RAG completas (base vectorial + LLM + interfaz)

Recomendada para Mili

Dify

Plataforma visual completa: RAG + chatbot + API en una sola herramienta. Sube documentos, crea base de conocimiento, configura LLM, obtiene widget de chat embebible y API REST. Multi-modelo: Claude, GPT-4o, Gemini. Open source o cloud.

Ventaja: Sin codigo. Chatbot web incluido. API para N8N.

Riesgo: Plataforma joven (2025). Menos precision que Vertex.

0 — 59 USD/mes

Recomendada para netelip

Google Vertex AI RAG Engine

Servicio gestionado de Google Cloud. Ingestión de datos desde Cloud Storage, Drive, archivos locales. Precision 90-97%. Reduccion de alucinaciones 40-80%. Requiere Python y Google Cloud Console. El equipo de devs de netelip puede montarlo.

Ventaja: Mejor precision. Ya usais Gemini con Elio.

Riesgo: Nivel tecnico alto. Costes pueden escalar sin control.

5 — 50 USD/mes (volumen bajo) | 300 USD creditos gratis

Comparativa WhatsApp API

Meta API oficial

Funciona con N8N Cloud
Respuestas servicio: gratis 24h
Click-to-WA ads: 72h gratis
Requiere verificacion empresa
Bots IA deben tener proposito claro
Recomendada para Mili

0-30 EUR/mes

Evolution API

Open source, muy popular
Solo N8N self-hosted
Necesita VPS + Docker
Chromium inestable a veces
Actualizaciones manuales frecuentes
Solo si migras a N8N self-hosted

~10 EUR/mes VPS

WAHA

REST API + webhooks
Compatible N8N Cloud via HTTP
Multi-sesion en un container
Docker en 5 min
Menos comunidad que Evolution
Alternativa viable

~10 EUR/mes VPS

Estrategia decidida — Stack simplificado

Stack definitivo Mili Perez / Mugen AI

Elio produccion: Retell AI + ElevenLabs turbo v2.5 + Gemini 2.0 Flash + netelip + N8N Cloud — No se toca
Demos y widgets: Gemini 3.1 Flash Live (Live API, gratis en preview, audio nativo) — Nuevo
RAG cerebro: Google Vertex AI RAG Engine (precision 90-97%, codigo con Claude) — Nuevo
Contenido: Claude (SPECs, SKILLs, voz de Mili) — Activo
Orquestacion: N8N Cloud (webhooks, flujos, conexiones) — Activo
WhatsApp: Por decidir API (Meta oficial vs Evolution vs WAHA) — Pendiente

Filosofia: menos herramientas, mas profundidad

Google para voz e infraestructura IA (Gemini 2.0 Flash en Elio, Gemini 3.1 Flash Live para demos, Vertex RAG para cerebro)
Claude para texto y contenido (articulos, posts, carruseles, SPECs, codigo)
Retell AI para produccion de agentes de voz (Elio y clientes)
N8N para orquestar todo
Netelip para telefonia IP
ElevenLabs para voz custom

Gemini 3.1 Flash Live — Para demos y widgets

Por que es brutal

Audio nativo: no transcribe, procesa audio directo
Latencia minima: responde a velocidad de conversacion
Barge-in: el usuario puede interrumpir
Function calling desde voz: 90.8% precision
Entiende tono, enfasis e intencion
Funciona en entornos ruidosos
Gratis en preview (marzo 2026)
WebSockets bidireccionales

Limitaciones actuales

En preview, no es GA todavia
Function calling solo secuencial (no paralelo)
Sin audio proactivo (era de 2.5)
Sin dialogo afectivo todavia
Cuotas variables por proyecto
Knowledge cutoff enero 2025
No sustituye a Elio en produccion
Requiere codigo (WebSockets + JS/Python)

Usar para

Demos espectaculares de agentes de voz
Widget de llamada en miliperez.com
Widget de llamada en blogs y landing pages
Mostrar potencial de IA conversacional
Prototipos rapidos de nuevos agentes
Formacion y presentaciones en vivo

No usar para

Produccion con clientes reales (usar Retell)
Sustituir a Elio (v179, probado, estable)
Llamadas telefonicas reales (no tiene SIP)
Nada que requiera SLA o uptime garantizado
Post-call analysis (no tiene esa capa)
Integracion con Cal.com/CRM (todavia)

Partners de integracion Gemini Live API

LiveKit

WebRTC + agentes

Pipecat (Daily)

Chatbot real-time

Voximplant

Inbound/outbound calls

Firebase AI SDK

Integracion web rapida

Alerta: Gemini 2.0 Flash deprecado

Gemini 2.0 Flash se apaga el 1 de junio de 2026. Elio corre sobre este modelo. Hay que migrar a Gemini 2.5 Flash o Gemini 3 Flash antes de esa fecha. Elio no se migra a Gemini 3.1 Flash Live — se migra dentro de Retell AI al modelo nuevo que soporte.

Dato clave: lo que mas importa en un RAG

La eleccion de base vectorial importa menos de lo que la gente piensa. La estrategia de chunking (como troceas los documentos) y el pipeline de recuperacion importan mucho mas. Empieza con cualquiera y optimiza el chunking.