9 proyectos. Stack real. Paso a paso, desde las trincheras. Primero supervisamos, luego delegamos.
01 — ProyectosLos 9 agentes
Total
9
En produccion
1
Por construir
8
Coste estimado
~280 EUR
Fase 1 — Cimientos
01Elio — Agente de voz en produccionRetell AI + N8N + Cal.com + netelipv179+
Agente de voz entrante para netelip. Cualifica contactos, agenda citas con Cal.com, transfiere llamadas. Post-call analysis con Gemini 2.5 Flash. 70+ palabras en diccionario de pronunciacion. Webhook a N8N Cloud para procesamiento.
Voz
ElevenLabs turbo v2.5 (custom voice)
LLM
Gemini 2.0 Flash via Retell LLM
Telefonia
netelip SIP trunk
Orquestacion
N8N Cloud (webhook post-call)
Agenda
Cal.com (reserva citas)
Coste
~120 EUR/mes (todo incluido)
02RAG — Cerebro de MiliBase conocimiento telefonia IPprioritario+
Base de conocimiento centralizada con toda la informacion de telefonia IP: tecnica, funcional y marketing. El cerebro que alimenta GPTs, chatbot web, WhatsApp y email. Una sola base, multiples salidas.
Contenido
Docs netelip + precios + guias tecnicas
Vectores
Por definir (Pinecone / Supabase / Qdrant)
LLM
Claude o GPT-4o (por evaluar)
Salidas
GPT, chatbot web, WhatsApp, email
03Demo — 3 agentes de vozRetell AI multi-agentemejorar+
Demo espectacular con 3 agentes interactuando: transferencias, agendado de citas, empatia. Muestra la potencia real de un sistema de voz IA. Automatizar post-call con WhatsApp o email en vez de pedir datos por voz.
Agentes
3 agentes Retell AI coordinados
Post-call
Automatizar envio WA / email
Objetivo
Vender el servicio de agentes de voz
Fase 2 — Escalar
04Agente de contenido — Voz de MiliClaude + SPECs + SKILLsnuevo+
Agente que conoce tu voz, tus SPECs (identidad visual, voz y tono, formato LinkedIn) y tus SKILLs (generar carruseles, articulos). Redacta posts, articulos de blog, carruseles con tu tono real. Ya lo estamos haciendo aqui.
Motor
Claude con proyecto personalizado
Contexto
SPEC-01 a 04 + SKILL-01
Salidas
Blog, LinkedIn, carruseles PDF
05GPTs especializadosOpenAI GPTs + base de datosnuevo+
GPTs con buenas bases de conocimiento y prompts potentes. Consultor 360 de telefonia IP con precios en tiempo real, asistente tecnico netelip, generador de presupuestos. Alimentados por el RAG (proyecto 02).
Plataforma
OpenAI GPTs con Actions
Base datos
RAG cerebro de Mili (P02)
Coste
~20 EUR/mes (ChatGPT Plus)
06Widget de llamada webRetell SDK + JS frontendnuevo+
Boton en tu web (o la de un cliente) que al hacer clic conecta con Elio. El visitante habla con el agente sin salir de la pagina. Widget con los colores de marca que cambia segun si el agente escucha o habla.
SDK
Retell Web SDK (client_key)
Frontend
Vanilla JS o React
Deploy
miliperez.com via Netlify/Vercel
Fase 3 — Expandir
07Instagram + avatares IAWorkflow creacion video IAnuevo+
Cuenta Instagram para vender servicios de Mugen AI. Avatares IA, reels automatizados, contenido con tu clon digital. Referencia: Miriam Lao. Workflow profesional de creacion de video con IA.
Imagenes
Midjourney / Flux / Ideogram
Video
Runway ML / Kling / Hailuo
Lip Sync
HeyGen / Runway Act 2
Voz
ElevenLabs (clon de tu voz)
Escalado
Topaz / Krea / Magnific
Grabacion
Loom (pantalla + cam flotante)
08WhatsApp IA — Clon de MiliAPI por definir + N8N + LLMnuevo+
Tu gemelo digital en WhatsApp. Habla como tu, responde como tu, usa tus expresiones. Stack por definir: Meta API oficial (compatible con N8N Cloud) vs Evolution API (requiere self-hosted) vs WAHA.
Opcion A
Meta Business API (funciona N8N Cloud)
Opcion B
Evolution API (requiere VPS + Docker)
Opcion C
WAHA (REST API + webhook)
LLM
Claude API (tu voz) + Gemini (fallback)
09Dashboard de monitorizacionN8N + Google Sheets / Lookernuevo+
Panel centralizado con todo lo que pasa: llamadas de Elio, mensajes del chatbot, leads, citas agendadas, metricas de contenido. Todo en un sitio para supervisar el ejercito antes de delegar.
Datos
N8N webhooks de todos los agentes
Almacen
Google Sheets o Supabase
Visualizacion
Looker Studio o HTML custom
02 — StackHerramientas
Voz
Retell AI
Plataforma de agentes de voz. Elio corre aqui. Latencia sub-segundo.
Activo
Voz
ElevenLabs
Voz custom turbo v2.5 para Elio. Clon de voz para contenido.
Activo
Telefonia
netelip
SIP trunk. Telefonia IP. 14 anos de experiencia.
Activo
Automatizacion
N8N Cloud
Orquestador central. Webhooks, flujos, conexiones entre agentes.
Activo
LLM
Claude
Contenido, SPECs, articulos, carruseles. Tu voz en texto.
Activo
LLM
Gemini 2.0 Flash
LLM de Elio en produccion. Rapido y barato para voz.
Activo
LLM
ChatGPT / GPTs
GPTs especializados con Actions y base de conocimiento.
Planificado
Agenda
Cal.com
Reserva de citas desde Elio. Plan gratuito.
Activo
CRM
HubSpot
Seguimiento de leads y oportunidades. Plan gratuito.
Planificado
Web
Netlify / Vercel
Deploy de miliperez.com y widgets. GitHub integration.
Activo
Imagen
Midjourney
Generacion de imagenes IA. Arte conceptual y visual.
Aprendiendo
Imagen
Flux / Ideogram
Alternativas de imagen IA. Texto en imagenes.
Aprendiendo
Edicion
Photoshop / Canva
Edicion de imagenes. Generative Fill. Inpainting.
Planificado
Escalado
Topaz / Krea / Magnific
Upscaling de imagenes y video con IA.
Aprendiendo
Video
Runway ML
Generacion de video IA. Inpainting. Super slow motion.
Aprendiendo
Video
Google VEO 3.1 / Kling
Modelos de video IA de ultima generacion.
Aprendiendo
Lip Sync
HeyGen / D-ID
Avatares IA con movimiento labial sincronizado.
Aprendiendo
Grabacion
Loom
Grabacion de pantalla con camara flotante. Tutoriales y demos.
Planificado
Musica
Suno / Soundful
Creacion de musica con IA para reels y videos.
Aprendiendo
Subtitulos
Veed / Submagic
Subtitulos automaticos para reels y videos.
Planificado
03 — WorkflowCreacion de contenido con IA
Workflow completo de creacion de contenido con IA adaptado al stack de Mili Perez.
Recopilar contenido marketing (casos de uso, beneficios)
Elegir base vectorial (Pinecone vs Supabase vs Qdrant)
Chunking y embedding de documentos
Configurar LLM con prompt de sistema
Probar con 20 preguntas reales
Conectar con N8N como API interna
P03 Demo 3 agentes mejorar
Definir los 3 roles de la demo
Revisar y mejorar prompts de cada agente
Configurar transferencias entre agentes
Automatizar post-call con WA o email
Grabar demo completa con Loom
Preparar landing/deck para mostrar demo
P04 Agente contenido Mili en progreso
Crear proyecto Claude con SPECs
Subir SPEC-01 a 04 y SKILL-01
Validar voz y tono con articulos reales
Crear SKILL para generacion de posts LinkedIn
Crear SKILL para newsletters
Documentar workflow de publicacion
P05 GPTs especializados pendiente
Esperar a que P02 RAG este listo
Crear GPT consultor telefonia IP
Conectar Actions con base de precios
Crear GPT soporte tecnico netelip
Crear GPT generador de presupuestos
Probar con consultas reales de clientes
P06 Widget llamada web pendiente
Obtener client_key de Retell SDK
Disenar boton flotante con colores marca
Implementar stream de audio bidireccional
Cambio de color segun estado (escucha/habla)
Integrar en miliperez.com
Probar en movil y desktop
P07 Instagram + avatares IA pendiente
Dominar workflow de creacion de video con IA
Crear cuenta Instagram Mili Perez / Mugen AI
Clonar voz en ElevenLabs para contenido
Crear primer avatar IA con HeyGen
Producir 3 reels de prueba
Definir calendario de publicacion
Automatizar pipeline con N8N
P08 WhatsApp IA pendiente
Decidir API: Meta oficial vs Evolution vs WAHA
Esperar a P02 RAG cerebro
Configurar API elegida + webhook N8N
Entrenar LLM con voz de Mili (50 textos ejemplo)
Clasificador de intenciones (tecnico, comercial, soporte)
Probar con 20 conversaciones simuladas
Lanzar en beta con contactos de confianza
P09 Dashboard pendiente
Definir metricas clave por agente
Configurar webhooks de todos los agentes a sheets
Montar dashboard en Looker Studio o HTML
Alertas automaticas por N8N (lead caliente, error)
Vista movil para monitorizar desde el telefono
10 — RiesgosDecisiones pendientes
Lo que puede bloquear o retrasar el proyecto si no se resuelve a tiempo.
Decisiones por tomar
API de WhatsApp: Meta oficial vs Evolution API vs WAHA
Meta funciona con N8N Cloud pero requiere verificacion de empresa. Evolution es gratis pero necesita VPS y no funciona con N8N Cloud. WAHA funciona via webhook pero tiene menos comunidad.
Impacto: medio — Bloquea P08
Base vectorial para el RAG: Pinecone vs Supabase vs Qdrant
Pinecone es el mas maduro pero de pago. Supabase tiene pgvector y ya lo conoces. Qdrant es open source y potente. La eleccion afecta coste y complejidad.
Impacto: alto — Bloquea P02, P05, P08
Migrar N8N a self-hosted o quedarse en Cloud
Cloud es mas facil (24 EUR/mes, sin mantenimiento). Self-hosted es mas barato y permite Evolution API, pero necesitas VPS y saber de Docker. Afecta a todo el stack.
Impacto: medio — Afecta P08 y costes generales
Upgrade Elio a ElevenLabs v3 conversational
Elio usa eleven_turbo_v2_5. Los audio tags de ElevenLabs necesitan eleven_v3_conversational. Migrar habilita expresividad pero requiere validar estabilidad.
Impacto: bajo — Mejora, no bloquea
Riesgos tecnicos
Evolution API inestable con Chromium
WhatsApp cambia el protocolo web frecuentemente. Chromium consume mucha RAM. Si se cae, el bot de WhatsApp deja de funcionar hasta reiniciar manualmente.
Impacto: alto — Si eliges Evolution API
Restricciones de Meta para bots IA en WhatsApp
Desde enero 2026 Meta prohibe chatbots IA de proposito general en WhatsApp. Tu bot necesita un proposito claro (asesora de telefonia IP) para cumplir la normativa.
Impacto: medio — Requiere definir bien el scope del bot
Alucinaciones del RAG con datos de precios
Si la base de conocimiento no esta bien estructurada, el LLM puede inventar precios o mezclar productos. Critico para netelip: un precio mal dado puede perder un cliente.
Impacto: alto — Requiere testing exhaustivo de P02
Coste de video IA para Instagram escalando
Midjourney + HeyGen + Runway pueden sumar rapido si produces mucho contenido. Necesitas definir un presupuesto mensual cerrado para contenido visual.
Impacto: medio — Controlar con presupuesto fijo
11 — KPIsMetricas de exito
Como sabes que cada agente funciona bien. Sin metricas no hay mejora.
P01 Elio (voz)
Tasa de citas agendadas> 30%
Llamadas completadas sin corte> 85%
Hallucinations detectadas0%
Duracion media de llamada2-4 min
Satisfaccion post-call> 4/5
P02 RAG cerebro
Precision de respuesta> 90%
Precios correctos100%
Tiempo de respuesta< 3s
Consultas sin respuesta< 5%
P03 Demo 3 agentes
Transferencias exitosas> 95%
Demos que generan lead> 40%
Tiempo total de la demo< 5 min
P04 Agente contenido
Articulos publicados / mes> 4
Posts LinkedIn / semana2-3
Reescrituras necesarias< 20%
Engagement LinkedIn> 3%
P07 Instagram
Reels publicados / semana3-5
Seguidores primer mes> 500
Leads desde Instagram> 5 / mes
Coste por reel producido< 5 EUR
P08 WhatsApp IA
Respuestas automaticas / total> 70%
Escalaciones a Mili real< 30%
Tiempo de respuesta< 10s
"Suena a Mili" (test ciego)> 80%
12 — RAGEvaluacion de opciones
Comparativa de bases vectoriales y plataformas RAG para decidir donde montar el cerebro de Mili. Dos mundos: Creadora de IA + Telefonia IP.
Estructura del RAG — Dos mundos
Mundo 1 — Creadora de IA
Agentes de voz con IA (Elio, arquitecturas)
Stack: Retell AI, ElevenLabs, N8N, Cal.com
Prompts, configuraciones, buenas practicas
Articulos de miliperez.com
Aprendizajes y errores en produccion
Mundo 2 — Telefonia IP
Productos y precios netelip
Configuraciones SIP, WebRTC, VoIP
Centralitas virtuales, integraciones CRM
Guias tecnicas para clientes
Marketing: casos de uso, beneficios
Plataforma visual completa: RAG + chatbot + API en una sola herramienta.
Sube documentos, crea base de conocimiento, configura LLM, obtiene widget de chat embebible y API REST.
Multi-modelo: Claude, GPT-4o, Gemini. Open source o cloud.
Ventaja: Sin codigo. Chatbot web incluido. API para N8N.
Riesgo: Plataforma joven (2025). Menos precision que Vertex.
0 — 59 USD/mes
Recomendada para netelip
Google Vertex AI RAG Engine
Servicio gestionado de Google Cloud. Ingestión de datos desde Cloud Storage, Drive, archivos locales.
Precision 90-97%. Reduccion de alucinaciones 40-80%.
Requiere Python y Google Cloud Console. El equipo de devs de netelip puede montarlo.
Ventaja: Mejor precision. Ya usais Gemini con Elio.
Riesgo: Nivel tecnico alto. Costes pueden escalar sin control.
Funciona con N8N Cloud
Respuestas servicio: gratis 24h
Click-to-WA ads: 72h gratis
Requiere verificacion empresa
Bots IA deben tener proposito claro Recomendada para Mili
0-30 EUR/mes
Evolution API
Open source, muy popular
Solo N8N self-hosted
Necesita VPS + Docker
Chromium inestable a veces
Actualizaciones manuales frecuentes Solo si migras a N8N self-hosted
~10 EUR/mes VPS
WAHA
REST API + webhooks
Compatible N8N Cloud via HTTP
Multi-sesion en un container
Docker en 5 min
Menos comunidad que Evolution Alternativa viable
~10 EUR/mes VPS
Estrategia decidida — Stack simplificado
Stack definitivo Mili Perez / Mugen AI
Elio produccion: Retell AI + ElevenLabs turbo v2.5 + Gemini 2.0 Flash + netelip + N8N Cloud — No se toca Demos y widgets: Gemini 3.1 Flash Live (Live API, gratis en preview, audio nativo) — Nuevo RAG cerebro: Google Vertex AI RAG Engine (precision 90-97%, codigo con Claude) — Nuevo Contenido: Claude (SPECs, SKILLs, voz de Mili) — Activo Orquestacion: N8N Cloud (webhooks, flujos, conexiones) — Activo WhatsApp: Por decidir API (Meta oficial vs Evolution vs WAHA) — Pendiente
Filosofia: menos herramientas, mas profundidad
Google para voz e infraestructura IA (Gemini 2.0 Flash en Elio, Gemini 3.1 Flash Live para demos, Vertex RAG para cerebro)
Claude para texto y contenido (articulos, posts, carruseles, SPECs, codigo)
Retell AI para produccion de agentes de voz (Elio y clientes)
N8N para orquestar todo
Netelip para telefonia IP
ElevenLabs para voz custom
Gemini 3.1 Flash Live — Para demos y widgets
Por que es brutal
Audio nativo: no transcribe, procesa audio directo
Latencia minima: responde a velocidad de conversacion
Barge-in: el usuario puede interrumpir
Function calling desde voz: 90.8% precision
Entiende tono, enfasis e intencion
Funciona en entornos ruidosos
Gratis en preview (marzo 2026)
WebSockets bidireccionales
Limitaciones actuales
En preview, no es GA todavia
Function calling solo secuencial (no paralelo)
Sin audio proactivo (era de 2.5)
Sin dialogo afectivo todavia
Cuotas variables por proyecto
Knowledge cutoff enero 2025
No sustituye a Elio en produccion
Requiere codigo (WebSockets + JS/Python)
Usar para
Demos espectaculares de agentes de voz
Widget de llamada en miliperez.com
Widget de llamada en blogs y landing pages
Mostrar potencial de IA conversacional
Prototipos rapidos de nuevos agentes
Formacion y presentaciones en vivo
No usar para
Produccion con clientes reales (usar Retell)
Sustituir a Elio (v179, probado, estable)
Llamadas telefonicas reales (no tiene SIP)
Nada que requiera SLA o uptime garantizado
Post-call analysis (no tiene esa capa)
Integracion con Cal.com/CRM (todavia)
Partners de integracion Gemini Live API
LiveKit
WebRTC + agentes
Pipecat (Daily)
Chatbot real-time
Voximplant
Inbound/outbound calls
Firebase AI SDK
Integracion web rapida
Alerta: Gemini 2.0 Flash deprecado
Gemini 2.0 Flash se apaga el 1 de junio de 2026. Elio corre sobre este modelo. Hay que migrar a Gemini 2.5 Flash o Gemini 3 Flash antes de esa fecha. Elio no se migra a Gemini 3.1 Flash Live — se migra dentro de Retell AI al modelo nuevo que soporte.
Dato clave: lo que mas importa en un RAG
La eleccion de base vectorial importa menos de lo que la gente piensa. La estrategia de chunking (como troceas los documentos) y el pipeline de recuperacion importan mucho mas. Empieza con cualquiera y optimiza el chunking.