SONIA IA
&
MILI PÉREZ
RAGBuilder
Convierte webs, vídeos, documentos y grabaciones en bases de conocimiento perfectas para agentes de voz.
Cómo funciona
Ingesta múltiple
Web, YouTube, PDF, DOC y grabaciones de audio en un solo pipeline.
Voice-optimized
Output específico para agentes de voz. Sin tablas, sin símbolos, chunks de 20 segundos.
Modular
KB separada en módulos temáticos. Actualiza precios sin regenerar todo el sistema.
Estado de implementación
Prototipo v1.0 — Pendiente de backend
Nota para implementación — Sonia IA
El workflow de n8n recibe un webhook POST en
/webhook/ragbuilder con el JSON de configuración del cliente. Procesa en paralelo las ramas activas (web, youtube, docs, audio), merge el output limpio y lo envía a Claude API con el prompt maestro. El resultado se parsea en 7 archivos .md y se guarda en Google Drive en kb-[cliente]/. Arquitectura completa documentada en RAGBuilder Arquitectura v1.0.docx.01 — Configuración
Nueva Knowledge Base
Define el cliente, selecciona las fuentes y configura los parámetros de ingesta.
Paso 1
Datos del cliente
Paso 2
Tipo de Knowledge Base
Voice Agent
Sin tablas · Chunks <20s · Lenguaje conversacional
Chatbot / GPT
Markdown · Tablas · Formato visual completo
Paso 3
Fuentes de información
Selecciona una o más
Web corporativa
Páginas de producto, servicios, about
Centro de ayuda
Artículos de soporte, FAQs, guías
Canal YouTube
Transcripciones automáticas de vídeos
Documentos
PDF, DOC, tarifas, contratos
Grabaciones de audio
Llamadas .mp3 / .wav / .m4a
Paso 4
Parámetros de las fuentes
Web corporativa
Prototipo — simulación de pipeline
La integración real con Firecrawl, YouTube API y Whisper se implementa en n8n. Este prototipo simula el proceso completo.
02 — Procesamiento
Pipeline en ejecución
Procesando: —
Módulo 01
Scraping web — Firecrawl
En espera...
Módulo 02
YouTube — Transcripciones
En espera...
Módulo 03
Parser — Documentos
En espera...
Módulo 04
Whisper — Transcripción de audio
En espera...
Motor central
Limpieza y normalización
En espera...
Claude API
Estructuración con IA — Voice-optimization
En espera...
Output
Generación de módulos Markdown
En espera...
03 — Knowledge Base
Knowledge Base — netelip
7 módulos generados · Voice Agent · Español Demo — datos simulados
Selecciona un módulo para ver su contenido.