Los Agentes de mensajería con IA pueden aprender directamente de su contenido público para ofrecer respuestas precisas, coherentes y alineadas con su marca durante las conversaciones con los clientes. Esto es posible gracias a las fuentes de conocimiento, que permiten a su Agente de mensajería con IA consultar información fiable en tiempo real. En este artículo se explica qué es una fuente de conocimiento, cómo beneficia a su Agente de mensajería con IA y cuáles son las limitaciones actuales que debe tener en cuenta.
¿Qué es una fuente de conocimiento?
Una fuente de conocimiento es una biblioteca centralizada de información sobre su empresa, como productos, servicios y preguntas frecuentes. Ayuda a garantizar que la información sea fácil de encontrar, fácil de consultar y fácil de entender para su Agente de mensajería con IA.
Aircall utiliza el contenido que usted proporciona, por ejemplo páginas web públicas, para crear una fuente de conocimiento en la que su Agente de mensajería con IA puede apoyarse durante las conversaciones con los clientes.
Cómo ayudan las fuentes de conocimiento a su Agente de mensajería con IA
Una vez que su contenido se añade como fuente de conocimiento, su Agente de mensajería con IA puede:
- Responder preguntas habituales utilizando información precisa y aprobada por la marca
- Mantener una comunicación coherente en todas las conversaciones
- Reducir las respuestas manuales repetitivas
- Consultar su contenido al instante durante las interacciones con los clientes
Esto garantiza que los clientes reciban respuestas precisas y útiles basadas directamente en su propia información publicada.
Tipos de contenido compatibles
Puede añadir nuevas fuentes de conocimiento de las siguientes maneras:
- Bloque de contenido: Pegue cualquier texto sin formato del que quiera que aprenda el agente.
- Página web: Añada una única URL pública.
- Sitio web: Añada un dominio público principal, con subpáginas opcionales.
- Fuentes existentes: Reutilice o actualice el contenido que ya haya añadido para su AI Voice Agent.
Nota: Todo el contenido añadido como fuente de conocimiento debe estar disponible públicamente. Las fuentes pueden compartirse entre su AI Voice Agent y su Agente de mensajería con IA. Si una regla o información se aplica solo a un canal, cree una fuente dedicada para ello en lugar de añadirla a una fuente compartida.
Limitaciones actuales
Para garantizar los mejores resultados, tenga en cuenta las siguientes limitaciones.
Páginas restringidas o que requieren autenticación
Las fuentes de conocimiento no pueden ingerir contenido de:
- Páginas que requieren inicio de sesión
- Áreas protegidas con contraseña
- Portales internos o paneles de control
- Páginas detrás de muros de pago
Solo se admiten URL públicas.
Contenido compuesto solo por imágenes
Si la información importante aparece solo en imágenes, como texto incrustado en imágenes, diagramas o capturas de pantalla, es posible que el Agente de mensajería con IA no pueda leerla ni utilizarla.
La carga de documentos aún no es compatible
Actualmente no puede cargar archivos como PDF, documentos de Word u hojas de cálculo.
Nota: La compatibilidad con la carga de documentos está prevista para una versión futura.
Gestión del rastreo de sitios web en sus fuentes de conocimiento
El contenido de sitios web añadido recientemente puede funcionar de forma fluida junto en sus fuentes de conocimiento. En esta sección se explica cómo funciona el rastreo de sitios web, cómo se procesa el contenido y qué límites se aplican.
Cómo funciona el rastreo de sitios web
Cuando añade una URL de sitio web a sus fuentes de conocimiento, Aircall procesa automáticamente la página que proporciona, las páginas a las que enlaza y las páginas a las que hacen referencia esas páginas enlazadas. Esto solo se aplica si las URL comparten el mismo prefijo.
Profundidad de rastreo
El rastreo cubre la página proporcionada y hasta dos niveles más profundos, siempre que las URL compartan el mismo prefijo.
Ejemplo
Si añade https://website.com/depth1/, el rastreador también puede procesar:
https://website.com/depth1/depth2https://website.com/depth1/depth2/depth3
No rastreará secciones no relacionadas como:
https://website.com/bloghttps://website.com/contact
Esto garantiza que solo se incluyan las secciones relevantes de su sitio web.
Revise y seleccione páginas de la URL de su sitio web
Después de añadir una URL de sitio web, puede revisar el mapa del sitio generado para esa fuente y ver qué páginas están asociadas a ella. Desde ahí, puede seleccionar o deseleccionar páginas para controlar exactamente qué se incluye en sus fuentes de conocimiento.
A medida que añade páginas, puede supervisar el indicador de límite de caracteres para ver cuánto del límite disponible está utilizando su fuente de conocimiento.
Cómo se extrae y limpia el contenido
Todo el contenido del sitio web pasa por un procesamiento de varias etapas para garantizar conocimiento de alta calidad.
| Categoría | Detalles | Propósito |
|---|---|---|
| Qué se elimina | Menús de navegación, encabezados y pies de página, banners de cookies, anuncios, imágenes y vídeos, scripts y código malicioso, ruido de formato y HTML redundante | Elimina elementos no esenciales y potencialmente inseguros para que solo se procese contenido relevante y limpio. |
| Qué se conserva | Encabezados, párrafos, listas, contenido estructurado del artículo | Preserva contenido estructurado y significativo que contribuye a una recuperación precisa del conocimiento. |
| Por qué esto es importante | Mejora la precisión de las respuestas, evita que el contenido irrelevante afecte a las respuestas, reduce el procesamiento innecesario, mejora la seguridad | Garantiza respuestas de mayor calidad y una mejor fiabilidad del Agente de mensajería con IA. |
Tiempos de procesamiento previstos
El tiempo de procesamiento depende del tamaño del rastreo:
- De 1 a 10 páginas normalmente se procesan en menos de un minuto.
- Las secciones de tamaño medio pueden tardar entre 5 y 10 minutos.
- Los rastreos grandes a nivel raíz pueden tardar hasta 30 minutos.
Puede supervisar el progreso mediante el indicador de estado del documento.
Buenas prácticas para la ingesta de sitios web
| Tema | Recomendación | Detalles |
|---|---|---|
| Comience con URL específicas | Añada páginas precisas con enlaces profundos en lugar de dominios raíz. | En lugar de https://website.com/, use una página específica como https://website.com/help/article-name. Cuanto más profunda sea la ruta de la URL, más específica será la exploración. |
| Amplíe gradualmente | Suba un nivel de directorio cada vez si necesita una cobertura más amplia. | Pase de https://website.com/help/article-name a https://website.com/help/. Evite añadir la URL raíz a menos que necesite contenido de todo el sitio. |
| Evite la exploración excesiva | No comience con URL de nivel raíz a menos que sea necesario. | Las URL de nivel raíz pueden capturar cientos de páginas, aumentar el tiempo de procesamiento, activar la resumición e introducir contenido irrelevante. |
| Use páginas de conocimiento estructuradas | Priorice páginas bien organizadas y centradas en el contenido. | Las fuentes con mejor rendimiento incluyen centros de ayuda, hubs de documentación, secciones de Preguntas frecuentes y artículos estructurados con encabezados claros. |
| Evite tipos de contenido no adecuados | Excluya páginas que sean dinámicas, restringidas o no estructuradas. | Evite páginas que requieran inicio de sesión, páginas de resultados de búsqueda, contenido dinámico o basado en formularios, feeds de noticias y páginas con mucho contenido multimedia. |
| Revise después de la exploración | Valide los resultados una vez que el procesamiento haya finalizado. | Revise la vista previa del documento para confirmar que se capturaron las páginas correctas, que no se añadieron URL duplicadas y que el contenido está estructurado correctamente. Más adelante puede actualizar el contenido del sitio web si la página de origen se actualiza. |
Consejo: Considere usar Preguntas frecuentes manuales o la entrada de texto en lugar de la exploración del sitio web cuando el contenido cambie con frecuencia (como noticias o datos en tiempo real), las páginas requieran autenticación, el sitio web se base principalmente en video o imágenes, o el contenido no esté estructurado.