Mugen AI S.L.U. — Hoja de ruta 2026

Ejercito de agentes IA

9 proyectos. Stack real. Paso a paso, desde las trincheras. Primero supervisamos, luego delegamos.

01 — Proyectos Los 9 agentes
Total
9
En produccion
1
Por construir
8
Coste estimado
~280 EUR
Fase 1 — Cimientos
01 Elio — Agente de voz en produccion Retell AI + N8N + Cal.com + netelip v179 +

Agente de voz entrante para netelip. Cualifica contactos, agenda citas con Cal.com, transfiere llamadas. Post-call analysis con Gemini 2.5 Flash. 70+ palabras en diccionario de pronunciacion. Webhook a N8N Cloud para procesamiento.

Voz
ElevenLabs turbo v2.5 (custom voice)
LLM
Gemini 2.0 Flash via Retell LLM
Telefonia
netelip SIP trunk
Orquestacion
N8N Cloud (webhook post-call)
Agenda
Cal.com (reserva citas)
Coste
~120 EUR/mes (todo incluido)
02 RAG — Cerebro de Mili Base conocimiento telefonia IP prioritario +

Base de conocimiento centralizada con toda la informacion de telefonia IP: tecnica, funcional y marketing. El cerebro que alimenta GPTs, chatbot web, WhatsApp y email. Una sola base, multiples salidas.

Contenido
Docs netelip + precios + guias tecnicas
Vectores
Por definir (Pinecone / Supabase / Qdrant)
LLM
Claude o GPT-4o (por evaluar)
Salidas
GPT, chatbot web, WhatsApp, email
03 Demo — 3 agentes de voz Retell AI multi-agente mejorar +

Demo espectacular con 3 agentes interactuando: transferencias, agendado de citas, empatia. Muestra la potencia real de un sistema de voz IA. Automatizar post-call con WhatsApp o email en vez de pedir datos por voz.

Agentes
3 agentes Retell AI coordinados
Post-call
Automatizar envio WA / email
Objetivo
Vender el servicio de agentes de voz
Fase 2 — Escalar
04 Agente de contenido — Voz de Mili Claude + SPECs + SKILLs nuevo +

Agente que conoce tu voz, tus SPECs (identidad visual, voz y tono, formato LinkedIn) y tus SKILLs (generar carruseles, articulos). Redacta posts, articulos de blog, carruseles con tu tono real. Ya lo estamos haciendo aqui.

Motor
Claude con proyecto personalizado
Contexto
SPEC-01 a 04 + SKILL-01
Salidas
Blog, LinkedIn, carruseles PDF
05 GPTs especializados OpenAI GPTs + base de datos nuevo +

GPTs con buenas bases de conocimiento y prompts potentes. Consultor 360 de telefonia IP con precios en tiempo real, asistente tecnico netelip, generador de presupuestos. Alimentados por el RAG (proyecto 02).

Plataforma
OpenAI GPTs con Actions
Base datos
RAG cerebro de Mili (P02)
Coste
~20 EUR/mes (ChatGPT Plus)
06 Widget de llamada web Retell SDK + JS frontend nuevo +

Boton en tu web (o la de un cliente) que al hacer clic conecta con Elio. El visitante habla con el agente sin salir de la pagina. Widget con los colores de marca que cambia segun si el agente escucha o habla.

SDK
Retell Web SDK (client_key)
Frontend
Vanilla JS o React
Deploy
miliperez.com via Netlify/Vercel
Fase 3 — Expandir
07 Instagram + avatares IA Workflow creacion video IA nuevo +

Cuenta Instagram para vender servicios de Mugen AI. Avatares IA, reels automatizados, contenido con tu clon digital. Referencia: Miriam Lao. Workflow profesional de creacion de video con IA.

Imagenes
Midjourney / Flux / Ideogram
Video
Runway ML / Kling / Hailuo
Lip Sync
HeyGen / Runway Act 2
Voz
ElevenLabs (clon de tu voz)
Escalado
Topaz / Krea / Magnific
Grabacion
Loom (pantalla + cam flotante)
08 WhatsApp IA — Clon de Mili API por definir + N8N + LLM nuevo +

Tu gemelo digital en WhatsApp. Habla como tu, responde como tu, usa tus expresiones. Stack por definir: Meta API oficial (compatible con N8N Cloud) vs Evolution API (requiere self-hosted) vs WAHA.

Opcion A
Meta Business API (funciona N8N Cloud)
Opcion B
Evolution API (requiere VPS + Docker)
Opcion C
WAHA (REST API + webhook)
LLM
Claude API (tu voz) + Gemini (fallback)
09 Dashboard de monitorizacion N8N + Google Sheets / Looker nuevo +

Panel centralizado con todo lo que pasa: llamadas de Elio, mensajes del chatbot, leads, citas agendadas, metricas de contenido. Todo en un sitio para supervisar el ejercito antes de delegar.

Datos
N8N webhooks de todos los agentes
Almacen
Google Sheets o Supabase
Visualizacion
Looker Studio o HTML custom
02 — Stack Herramientas
Voz
Retell AI
Plataforma de agentes de voz. Elio corre aqui. Latencia sub-segundo.
Activo
Voz
ElevenLabs
Voz custom turbo v2.5 para Elio. Clon de voz para contenido.
Activo
Telefonia
netelip
SIP trunk. Telefonia IP. 14 anos de experiencia.
Activo
Automatizacion
N8N Cloud
Orquestador central. Webhooks, flujos, conexiones entre agentes.
Activo
LLM
Claude
Contenido, SPECs, articulos, carruseles. Tu voz en texto.
Activo
LLM
Gemini 2.0 Flash
LLM de Elio en produccion. Rapido y barato para voz.
Activo
LLM
ChatGPT / GPTs
GPTs especializados con Actions y base de conocimiento.
Planificado
Agenda
Cal.com
Reserva de citas desde Elio. Plan gratuito.
Activo
CRM
HubSpot
Seguimiento de leads y oportunidades. Plan gratuito.
Planificado
Web
Netlify / Vercel
Deploy de miliperez.com y widgets. GitHub integration.
Activo
Imagen
Midjourney
Generacion de imagenes IA. Arte conceptual y visual.
Aprendiendo
Imagen
Flux / Ideogram
Alternativas de imagen IA. Texto en imagenes.
Aprendiendo
Edicion
Photoshop / Canva
Edicion de imagenes. Generative Fill. Inpainting.
Planificado
Escalado
Topaz / Krea / Magnific
Upscaling de imagenes y video con IA.
Aprendiendo
Video
Runway ML
Generacion de video IA. Inpainting. Super slow motion.
Aprendiendo
Video
Google VEO 3.1 / Kling
Modelos de video IA de ultima generacion.
Aprendiendo
Lip Sync
HeyGen / D-ID
Avatares IA con movimiento labial sincronizado.
Aprendiendo
Grabacion
Loom
Grabacion de pantalla con camara flotante. Tutoriales y demos.
Planificado
Musica
Suno / Soundful
Creacion de musica con IA para reels y videos.
Aprendiendo
Subtitulos
Veed / Submagic
Subtitulos automaticos para reels y videos.
Planificado
03 — Workflow Creacion de contenido con IA

Workflow completo de creacion de contenido con IA adaptado al stack de Mili Perez.

Generar la idea
ChatGPT / Claude / Gemini
Crear el guion
Claude (con SPEC-02 voz de Mili) / ChatGPT
Refinar el guion
Claude / Google Docs / Notion AI
Crear lista de planos (shot list)
Claude / Google Sheets
Crear arte de imagenes
Midjourney / Flux / Ideogram / DALL-E / Adobe Firefly
Crear voz en off (voice over)
ElevenLabs (clon de tu voz) / Lovo
Editar animatic basico
Descript / Runway / DaVinci Resolve
Anadir musica
Suno / Soundful / Soundraw
Escalar imagenes del proyecto
Krea / Magnific / Topaz Gigapixel AI
Crear movimientos labiales (lip sync)
HeyGen / Runway Lipsync / D-ID
Eliminar marcas de agua
Canva / Photoshop Generative Fill
Preparar activos para animacion
Canva / Clipdrop / Runway
Crear movimientos cinematicos
After Effects / LeiaPix / Runway
Compilar proyecto final
DaVinci Resolve / CapCut / Premiere Pro
Escalar y suavizar video
Topaz Video AI / Runway Super Slow Motion
Anadir subtitulos
Veed / Submagic
Crear descripcion y etiquetas
Claude (SPEC-02 voz Mili) / ChatGPT
Distribuir en linea
Instagram / LinkedIn / YouTube / TikTok
04 — Arquitectura Diagrama del sistema
Capa 1 — Canales de entrada
Voz
Elio + netelip
WhatsApp
Por definir API
Web chat
Chatbot RAG
Email
Gmail + N8N
↓ ↓ ↓ ↓
N8N — Router central
Clasifica, enruta, orquesta
↓ ↓ ↓
Cliente existente
Transferir / soporte
Lead nuevo
Cualificar / agendar
Consulta tecnica
RAG / GPT responde
Capa 2 — Cerebro central (RAG)
Base de conocimiento
Telefonia IP + marketing + tecnico + precios netelip
Alimenta a
GPTs
Alimenta a
Chatbot web
Alimenta a
WhatsApp IA
Alimenta a
Email IA
Alimenta a
Elio (voz)
Capa 3 — Pipeline de contenido
LLM
Claude
ChatGPT
Gemini
Imagen
Midjourney
Flux
Ideogram
Edicion
Photoshop
Canva
Krea
Video
Runway ML
VEO 3.1
Kling
Escalado
Topaz
Magnific
Krea
Sonido
ElevenLabs
Suno
Soundful
Lip Sync
HeyGen
D-ID
Runway Act 2
05 — Flujos Diagramas de flujo

Flujo de cada proceso clave. Asi funciona cada pieza del ejercito por dentro.

Flujo 1 — Llamada entrante (Elio)
Cliente llama al numero netelip
SIP trunk recibe la llamada
Retell AI conecta con Elio
Saludo personalizado, deteccion de idioma
Elio pregunta: eres cliente?
Cualificacion del contacto
Si — Cliente
Transferir al departamento correspondiente
No — Lead nuevo
Continuar cualificacion
Capturar nombre, email, telefono
Deletreo de email, confirmacion verbal
N8N comprueba disponibilidad en Cal.com
Webhook consulta horarios libres
Elio ofrece horarios al contacto
Transforma en formato natural (manana a las 10)
Reserva la cita en Cal.com
Confirmacion verbal al contacto
Post-call: Gemini analiza la llamada
Resumen, datos capturados, cita_reservada: true/false
N8N procesa el reporte
Webhook post-call envia datos al equipo
Flujo 2 — Consulta WhatsApp IA
Cliente escribe por WhatsApp
Mensaje entrante via API
N8N recibe el webhook
Clasifica tipo de mensaje (texto, audio, imagen)
Tipo de consulta?
Clasificacion por intencion
Telefonia IP
RAG responde con base de conocimiento
Comercial / cita
Escala a Mili o agenda automaticamente
LLM genera respuesta con voz de Mili
Claude API + contexto RAG + tono SPEC-02
Envia respuesta por WhatsApp
Texto natural, sin parecer bot
Flujo 3 — Creacion de contenido Instagram
Definir tema y objetivo del reel
Claude genera idea + guion con SPEC-02
Crear shot list y storyboard
Lista de planos con prompts para cada imagen
Generar imagenes con IA
Midjourney / Flux / Ideogram
Crear voice over con ElevenLabs
Clon de voz de Mili leyendo el guion
Generar video / lip sync
HeyGen o Runway para avatar animado
Editar y compilar
CapCut / DaVinci + musica (Suno) + subtitulos (Veed)
Escalar y pulir
Topaz / Magnific para calidad final
Publicar + descripcion + hashtags
Claude genera copy con SPEC-02
Flujo 4 — RAG: consulta a la base de conocimiento
Pregunta llega por cualquier canal
Voz / WhatsApp / web chat / email / GPT
Convertir pregunta en embedding
Modelo de embeddings vectoriza la consulta
Buscar en base de datos vectorial
Pinecone / Supabase / Qdrant — similaridad coseno
Recuperar fragmentos relevantes
Top 3-5 chunks mas similares a la pregunta
LLM genera respuesta con contexto
Claude / GPT-4o + fragmentos + prompt de sistema
Respuesta al canal de origen
Formateada segun el canal (voz breve, texto detallado)
06 — Mapas Mapas mentales

Vision global de cada area. Para ver de un vistazo como se conecta todo.

Mugen AI — Ejercito de agentes
Agentes de voz
Elio produccion (v179)
Demo 3 agentes (mejorar)
Widget llamada web SDK
Agente empatico avanzado
Agentes de texto
WhatsApp IA clon Mili
Chatbot web RAG
Email IA automatizado
GPTs especializados
Contenido
Blog miliperez.com (Claude + SPECs)
Carruseles LinkedIn (SKILL-01)
Instagram + avatares IA
Reels con clon de voz
Stack tecnologico por capa
Capa 1: Canales
Telefono (netelip SIP)
WhatsApp (API por definir)
Web chat (chatbot RAG)
Email (Gmail + N8N)
Instagram DM (API Meta)
Capa 2: Cerebro
RAG base conocimiento
Vectores (Pinecone/Supabase)
LLM voz: Gemini 2.0 Flash
LLM texto: Claude
LLM GPTs: OpenAI
Capa 3: Orquestacion
N8N Cloud (webhooks)
Cal.com (agenda)
HubSpot CRM (leads)
Dashboard monitor
Pipeline de contenido IA
Texto y guion
Claude (voz de Mili, SPECs)
ChatGPT (ideas, brainstorm)
Gemini (alternativa rapida)
Visual
Midjourney (arte conceptual)
Flux / Ideogram (texto en imagen)
Photoshop / Canva (edicion)
Topaz / Magnific (escalado)
Video y audio
Runway ML / VEO 3.1 (generacion)
ElevenLabs (clon de voz)
HeyGen / D-ID (lip sync avatar)
Suno (musica IA)
Loom (grabacion pantalla)
Distribucion
LinkedIn (posts + carruseles)
Blog miliperez.com
Instagram (nueva cuenta)
YouTube (futuro)
Veed / Submagic (subtitulos)
Hoja de ruta temporal
Semanas 1-3
Elio v179 estable
Montar RAG cerebro de Mili
Mejorar demo 3 agentes
Definir API WhatsApp
Semanas 3-6
Agente contenido operativo
GPTs con base precios
Widget llamada en web
WhatsApp IA v1
Semanas 6-10
Cuenta Instagram activa
Primeros reels con avatar
Dashboard monitorizacion
Evaluar orquestador
07 — Costes Desglose por proyecto
ProyectoHerramientasFijo/mesVariableTotal est.
01 Elio produccionRetell + ElevenLabs + netelip0 EUR~0.11-0.15 EUR/min~120 EUR
02 RAG cerebro MiliVectores + LLM API0-25 EUR~0.01 EUR/consulta~25 EUR
03 Demo 3 agentesRetell (compartido con P01)0 EURIncluido en P010 EUR
04 Agente contenidoClaude Pro20 EUR20 EUR
05 GPTs especializadosChatGPT Plus20 EUR20 EUR
06 Widget llamada webRetell SDK (compartido con P01)0 EURIncluido en P010 EUR
07 Instagram + avataresMidjourney + HeyGen + Suno~40 EURVariable por uso~50 EUR
08 WhatsApp IAAPI WA + LLM + VPS?0-10 EUR~0.01-0.05 EUR/msg~20 EUR
09 DashboardGoogle Sheets/Looker (gratis)0 EUR0 EUR
N8N Cloud (compartido)24 EUR24 EUR
Total mensual estimado~279 EUR

Proyectos 03 y 06 comparten infraestructura con Elio (P01). Cal.com y HubSpot tienen plan gratuito.

08 — Dependencias Que necesita cada proyecto

No puedes construir todo en paralelo. Algunas piezas dependen de otras. Este mapa te dice en que orden ir.

P01 Elio produccion
Sin dependencias — ya en produccion
P02 RAG cerebro
Documentacion de netelip recopilada
Base de precios actualizada
Decidir base vectorial
P03 Demo 3 agentes
P01 Elio estable (hecho)
Definir los 3 roles de la demo
P04 Agente contenido
SPECs y SKILLs actualizados (hecho)
Ya operativo en Claude
P05 GPTs especializados
P02 RAG montado (bloqueante)
Base de precios en formato consultable
P06 Widget llamada web
P01 Elio estable (hecho)
Codigo frontend (JS/React)
P07 Instagram + avatares
Workflow de video IA dominado
Clon de voz en ElevenLabs
Cuenta Instagram creada
P08 WhatsApp IA
P02 RAG montado (bloqueante)
API WhatsApp decidida (bloqueante)
Entrenamiento con tu voz (textos)
P09 Dashboard
P01 Elio con webhooks (hecho)
Al menos 2 agentes activos
Definir metricas clave

Las lineas rojas son bloqueantes: no puedes empezar ese proyecto sin resolver la dependencia.

09 — Tareas Checklist por proyecto

Haz clic en cualquier tarea para marcarla como hecha. Tu lista de accion concreta.

P01 Elio produccion completado
  • Crear agente en Retell AI
  • Configurar voz custom ElevenLabs
  • Conectar SIP trunk netelip
  • Montar flujo N8N para Cal.com
  • Configurar post-call analysis Gemini
  • Diccionario pronunciacion (70+ palabras)
  • Probar en produccion real
P02 RAG cerebro de Mili prioritario
  • Recopilar toda la documentacion netelip
  • Estructurar base de precios (productos, planes, paises)
  • Recopilar guias tecnicas (SIP, VoIP, configuraciones)
  • Recopilar contenido marketing (casos de uso, beneficios)
  • Elegir base vectorial (Pinecone vs Supabase vs Qdrant)
  • Chunking y embedding de documentos
  • Configurar LLM con prompt de sistema
  • Probar con 20 preguntas reales
  • Conectar con N8N como API interna
P03 Demo 3 agentes mejorar
  • Definir los 3 roles de la demo
  • Revisar y mejorar prompts de cada agente
  • Configurar transferencias entre agentes
  • Automatizar post-call con WA o email
  • Grabar demo completa con Loom
  • Preparar landing/deck para mostrar demo
P04 Agente contenido Mili en progreso
  • Crear proyecto Claude con SPECs
  • Subir SPEC-01 a 04 y SKILL-01
  • Validar voz y tono con articulos reales
  • Crear SKILL para generacion de posts LinkedIn
  • Crear SKILL para newsletters
  • Documentar workflow de publicacion
P05 GPTs especializados pendiente
  • Esperar a que P02 RAG este listo
  • Crear GPT consultor telefonia IP
  • Conectar Actions con base de precios
  • Crear GPT soporte tecnico netelip
  • Crear GPT generador de presupuestos
  • Probar con consultas reales de clientes
P06 Widget llamada web pendiente
  • Obtener client_key de Retell SDK
  • Disenar boton flotante con colores marca
  • Implementar stream de audio bidireccional
  • Cambio de color segun estado (escucha/habla)
  • Integrar en miliperez.com
  • Probar en movil y desktop
P07 Instagram + avatares IA pendiente
  • Dominar workflow de creacion de video con IA
  • Crear cuenta Instagram Mili Perez / Mugen AI
  • Clonar voz en ElevenLabs para contenido
  • Crear primer avatar IA con HeyGen
  • Producir 3 reels de prueba
  • Definir calendario de publicacion
  • Automatizar pipeline con N8N
P08 WhatsApp IA pendiente
  • Decidir API: Meta oficial vs Evolution vs WAHA
  • Esperar a P02 RAG cerebro
  • Configurar API elegida + webhook N8N
  • Entrenar LLM con voz de Mili (50 textos ejemplo)
  • Clasificador de intenciones (tecnico, comercial, soporte)
  • Probar con 20 conversaciones simuladas
  • Lanzar en beta con contactos de confianza
P09 Dashboard pendiente
  • Definir metricas clave por agente
  • Configurar webhooks de todos los agentes a sheets
  • Montar dashboard en Looker Studio o HTML
  • Alertas automaticas por N8N (lead caliente, error)
  • Vista movil para monitorizar desde el telefono
10 — Riesgos Decisiones pendientes

Lo que puede bloquear o retrasar el proyecto si no se resuelve a tiempo.

Decisiones por tomar
API de WhatsApp: Meta oficial vs Evolution API vs WAHA
Meta funciona con N8N Cloud pero requiere verificacion de empresa. Evolution es gratis pero necesita VPS y no funciona con N8N Cloud. WAHA funciona via webhook pero tiene menos comunidad.
Impacto: medio — Bloquea P08
Base vectorial para el RAG: Pinecone vs Supabase vs Qdrant
Pinecone es el mas maduro pero de pago. Supabase tiene pgvector y ya lo conoces. Qdrant es open source y potente. La eleccion afecta coste y complejidad.
Impacto: alto — Bloquea P02, P05, P08
Migrar N8N a self-hosted o quedarse en Cloud
Cloud es mas facil (24 EUR/mes, sin mantenimiento). Self-hosted es mas barato y permite Evolution API, pero necesitas VPS y saber de Docker. Afecta a todo el stack.
Impacto: medio — Afecta P08 y costes generales
Upgrade Elio a ElevenLabs v3 conversational
Elio usa eleven_turbo_v2_5. Los audio tags de ElevenLabs necesitan eleven_v3_conversational. Migrar habilita expresividad pero requiere validar estabilidad.
Impacto: bajo — Mejora, no bloquea
Riesgos tecnicos
Evolution API inestable con Chromium
WhatsApp cambia el protocolo web frecuentemente. Chromium consume mucha RAM. Si se cae, el bot de WhatsApp deja de funcionar hasta reiniciar manualmente.
Impacto: alto — Si eliges Evolution API
Restricciones de Meta para bots IA en WhatsApp
Desde enero 2026 Meta prohibe chatbots IA de proposito general en WhatsApp. Tu bot necesita un proposito claro (asesora de telefonia IP) para cumplir la normativa.
Impacto: medio — Requiere definir bien el scope del bot
Alucinaciones del RAG con datos de precios
Si la base de conocimiento no esta bien estructurada, el LLM puede inventar precios o mezclar productos. Critico para netelip: un precio mal dado puede perder un cliente.
Impacto: alto — Requiere testing exhaustivo de P02
Coste de video IA para Instagram escalando
Midjourney + HeyGen + Runway pueden sumar rapido si produces mucho contenido. Necesitas definir un presupuesto mensual cerrado para contenido visual.
Impacto: medio — Controlar con presupuesto fijo
11 — KPIs Metricas de exito

Como sabes que cada agente funciona bien. Sin metricas no hay mejora.

P01 Elio (voz)
Tasa de citas agendadas> 30%
Llamadas completadas sin corte> 85%
Hallucinations detectadas0%
Duracion media de llamada2-4 min
Satisfaccion post-call> 4/5
P02 RAG cerebro
Precision de respuesta> 90%
Precios correctos100%
Tiempo de respuesta< 3s
Consultas sin respuesta< 5%
P03 Demo 3 agentes
Transferencias exitosas> 95%
Demos que generan lead> 40%
Tiempo total de la demo< 5 min
P04 Agente contenido
Articulos publicados / mes> 4
Posts LinkedIn / semana2-3
Reescrituras necesarias< 20%
Engagement LinkedIn> 3%
P07 Instagram
Reels publicados / semana3-5
Seguidores primer mes> 500
Leads desde Instagram> 5 / mes
Coste por reel producido< 5 EUR
P08 WhatsApp IA
Respuestas automaticas / total> 70%
Escalaciones a Mili real< 30%
Tiempo de respuesta< 10s
"Suena a Mili" (test ciego)> 80%
12 — RAG Evaluacion de opciones

Comparativa de bases vectoriales y plataformas RAG para decidir donde montar el cerebro de Mili. Dos mundos: Creadora de IA + Telefonia IP.

Estructura del RAG — Dos mundos
Mundo 1 — Creadora de IA
Agentes de voz con IA (Elio, arquitecturas)
Stack: Retell AI, ElevenLabs, N8N, Cal.com
Prompts, configuraciones, buenas practicas
Articulos de miliperez.com
Aprendizajes y errores en produccion
Mundo 2 — Telefonia IP
Productos y precios netelip
Configuraciones SIP, WebRTC, VoIP
Centralitas virtuales, integraciones CRM
Guias tecnicas para clientes
Marketing: casos de uso, beneficios
Comparativa bases vectoriales
Supabase pgvectorQdrantPineconeGoogle Vertex RAGChromaDB
Nivel tecnicoBajoMedioBajoAlto (Python, GCP)Bajo
Coste mensual0 EUR (free tier)30-50 EUR (VPS)0-70 USD5-50 USD0-15 EUR (VPS)
Precision RAGBuenaMuy buenaMuy buenaExcelente (90-97%)Buena
Filtrado avanzadoSQL (basico)El mejor del mercadoBuenoMuy buenoBasico
Busqueda hibridaNo nativaSiSiSiNo
Multi-modelo LLMTu eligesTu eligesTu eligesSolo GeminiTu eliges
Chatbot incluidoNoNoNoNoNo
API para N8NSi (REST)Si (REST)SiSiSi
EscalabilidadMedia (<3M vec)AltaAltaMaximaBaja (<5M vec)
Free tier500 MB1 GB cloud2 GB300 USD creditosGratis (self-host)
Open sourceSiSi (Apache 2.0)NoNoSi (Apache 2.0)
Ideal paraMili solaNetelip + devsPrototipo rapidoNetelip + devsPrototipo local
Plataformas RAG completas (base vectorial + LLM + interfaz)
Recomendada para Mili
Dify
Plataforma visual completa: RAG + chatbot + API en una sola herramienta. Sube documentos, crea base de conocimiento, configura LLM, obtiene widget de chat embebible y API REST. Multi-modelo: Claude, GPT-4o, Gemini. Open source o cloud.
Ventaja: Sin codigo. Chatbot web incluido. API para N8N.
Riesgo: Plataforma joven (2025). Menos precision que Vertex.
0 — 59 USD/mes
Recomendada para netelip
Google Vertex AI RAG Engine
Servicio gestionado de Google Cloud. Ingestión de datos desde Cloud Storage, Drive, archivos locales. Precision 90-97%. Reduccion de alucinaciones 40-80%. Requiere Python y Google Cloud Console. El equipo de devs de netelip puede montarlo.
Ventaja: Mejor precision. Ya usais Gemini con Elio.
Riesgo: Nivel tecnico alto. Costes pueden escalar sin control.
5 — 50 USD/mes (volumen bajo) | 300 USD creditos gratis
Comparativa WhatsApp API
Meta API oficial
Funciona con N8N Cloud
Respuestas servicio: gratis 24h
Click-to-WA ads: 72h gratis
Requiere verificacion empresa
Bots IA deben tener proposito claro
Recomendada para Mili
0-30 EUR/mes
Evolution API
Open source, muy popular
Solo N8N self-hosted
Necesita VPS + Docker
Chromium inestable a veces
Actualizaciones manuales frecuentes
Solo si migras a N8N self-hosted
~10 EUR/mes VPS
WAHA
REST API + webhooks
Compatible N8N Cloud via HTTP
Multi-sesion en un container
Docker en 5 min
Menos comunidad que Evolution
Alternativa viable
~10 EUR/mes VPS
Estrategia decidida — Stack simplificado
Stack definitivo Mili Perez / Mugen AI
Elio produccion: Retell AI + ElevenLabs turbo v2.5 + Gemini 2.0 Flash + netelip + N8N Cloud — No se toca
Demos y widgets: Gemini 3.1 Flash Live (Live API, gratis en preview, audio nativo) — Nuevo
RAG cerebro: Google Vertex AI RAG Engine (precision 90-97%, codigo con Claude) — Nuevo
Contenido: Claude (SPECs, SKILLs, voz de Mili) — Activo
Orquestacion: N8N Cloud (webhooks, flujos, conexiones) — Activo
WhatsApp: Por decidir API (Meta oficial vs Evolution vs WAHA) — Pendiente
Filosofia: menos herramientas, mas profundidad
Google para voz e infraestructura IA (Gemini 2.0 Flash en Elio, Gemini 3.1 Flash Live para demos, Vertex RAG para cerebro)
Claude para texto y contenido (articulos, posts, carruseles, SPECs, codigo)
Retell AI para produccion de agentes de voz (Elio y clientes)
N8N para orquestar todo
Netelip para telefonia IP
ElevenLabs para voz custom
Gemini 3.1 Flash Live — Para demos y widgets
Por que es brutal
Audio nativo: no transcribe, procesa audio directo
Latencia minima: responde a velocidad de conversacion
Barge-in: el usuario puede interrumpir
Function calling desde voz: 90.8% precision
Entiende tono, enfasis e intencion
Funciona en entornos ruidosos
Gratis en preview (marzo 2026)
WebSockets bidireccionales
Limitaciones actuales
En preview, no es GA todavia
Function calling solo secuencial (no paralelo)
Sin audio proactivo (era de 2.5)
Sin dialogo afectivo todavia
Cuotas variables por proyecto
Knowledge cutoff enero 2025
No sustituye a Elio en produccion
Requiere codigo (WebSockets + JS/Python)
Usar para
Demos espectaculares de agentes de voz
Widget de llamada en miliperez.com
Widget de llamada en blogs y landing pages
Mostrar potencial de IA conversacional
Prototipos rapidos de nuevos agentes
Formacion y presentaciones en vivo
No usar para
Produccion con clientes reales (usar Retell)
Sustituir a Elio (v179, probado, estable)
Llamadas telefonicas reales (no tiene SIP)
Nada que requiera SLA o uptime garantizado
Post-call analysis (no tiene esa capa)
Integracion con Cal.com/CRM (todavia)
Partners de integracion Gemini Live API
LiveKit
WebRTC + agentes
Pipecat (Daily)
Chatbot real-time
Voximplant
Inbound/outbound calls
Firebase AI SDK
Integracion web rapida
Alerta: Gemini 2.0 Flash deprecado
Gemini 2.0 Flash se apaga el 1 de junio de 2026. Elio corre sobre este modelo. Hay que migrar a Gemini 2.5 Flash o Gemini 3 Flash antes de esa fecha. Elio no se migra a Gemini 3.1 Flash Live — se migra dentro de Retell AI al modelo nuevo que soporte.
Dato clave: lo que mas importa en un RAG
La eleccion de base vectorial importa menos de lo que la gente piensa. La estrategia de chunking (como troceas los documentos) y el pipeline de recuperacion importan mucho mas. Empieza con cualquiera y optimiza el chunking.