Los AI Voice Agents de Aircall pueden aprender directamente de su contenido público para ofrecer respuestas precisas, coherentes y alineadas con su marca durante las llamadas de los clientes. Esto es posible gracias a las Fuentes de conocimiento, que permiten que su agente consulte información confiable en tiempo real. En este artículo se explica qué es una Información de la empresa, cómo beneficia a su agente y cuáles son las limitaciones actuales que debe tener en cuenta.

¿Qué es una Información de la empresa?

Una Información de la empresa es una biblioteca centralizada de información sobre su empresa, como productos, servicios y preguntas frecuentes. Ayuda a garantizar que la información sea fácil de encontrar, fácil de consultar y fácil de entender para sus agentes.

Aircall utiliza el contenido que usted proporciona, por ejemplo páginas web públicas, para crear una Información de la empresa en la que sus agentes pueden apoyarse durante las conversaciones con los clientes.

Cómo ayudan las fuentes de conocimiento a sus agentes

Una vez que su contenido se añade como Fuente de conocimiento, su agente puede:

  • Responder preguntas habituales con información precisa y aprobada por la marca
  • Mantener mensajes coherentes en todas las llamadas
  • Reducir las respuestas manuales repetitivas
  • Consultar su contenido al instante durante las interacciones con los clientes

Esto garantiza que quienes llaman reciban respuestas precisas y útiles basadas directamente en su propia información publicada.

Image showing how to add content sources and the interface

Tipos de contenido compatibles

Puede añadir nuevas Fuentes de conocimiento de las siguientes maneras:

  • Bloque de contenido: Pegue cualquier texto sin formato del que quiera que aprenda el agente
  • Página web: Añada una única URL pública
  • Sitio web: Añada un dominio público principal, con subpáginas opcionales
  • Fuentes existentes: Reutilice o actualice el contenido que ya ha añadido
Nota: Todo el contenido añadido como Fuente de conocimiento debe estar disponible públicamente.

Limitaciones actuales

Para garantizar los mejores resultados, tenga en cuenta las siguientes limitaciones.

Páginas restringidas o que requieren autenticación

Las Fuentes de conocimiento no pueden ingerir contenido de:

  • Páginas que requieren inicio de sesión
  • Áreas protegidas con contraseña
  • Portales internos o paneles
  • Páginas tras muros de pago

Solo se admiten URL públicas.

Contenido solo con imágenes

Si la información importante aparece solo como imágenes, como texto incrustado en imágenes, diagramas o capturas de pantalla, es posible que el agente no pueda leerla ni utilizarla.

La carga de documentos todavía no es compatible

Actualmente no puede cargar archivos como:

  • PDF
  • Documentos de Word
  • Hojas de cálculo
Importante: La compatibilidad con la carga de documentos está prevista para una versión futura.

Gestión de Preguntas frecuentes y rastreo de sitios web en su Centro de ayuda

Sus Preguntas frecuentes existentes y el contenido de sitio web que añada recientemente pueden funcionar juntos sin problemas en su Centro de ayuda. En este artículo se explica cómo se gestionan las Preguntas frecuentes, cómo funciona el rastreo de sitios web, cómo se procesa el contenido y qué límites se aplican a su AI Voice Agent.

¿Qué ocurre con mis Preguntas frecuentes existentes?

No necesita eliminar ni modificar sus Preguntas frecuentes existentes. Sus Preguntas frecuentes actuales se guardan automáticamente como Preguntas frecuentes de [Nombre del agente], y su AI Voice Agent sigue utilizándolas como fuente de conocimiento. Puede combinar varios tipos de fuentes de conocimiento, entre ellos:

  • Preguntas frecuentes o entradas de texto libre
  • URL individuales
  • Sitios web rastreados

Todas las fuentes de conocimiento se tratan por igual. Actualmente no existe priorización ni ponderación entre diferentes fuentes.

Cómo funciona el rastreo de sitios web

Cuando añade una URL de sitio web a su Centro de ayuda, Aircall procesa automáticamente:

  • La página que proporciona
  • Las páginas a las que enlaza
  • Las páginas a las que hacen referencia esas páginas enlazadas

Esto solo se aplica si las URL comparten el mismo prefijo.

Profundidad de rastreo

Rastreamos:

  • La página proporcionada
  • Hasta dos niveles más de profundidad
  • Solo si las URL comparten el mismo prefijo

Ejemplo

Si añade: https://website.com/depth1/

También podemos rastrear:

  • https://website.com/depth1/depth2
  • https://website.com/depth1/depth2/depth3

No rastrearemos secciones no relacionadas como:

  • https://website.com/blog
  • https://website.com/contact

Esto garantiza que solo se incluyan secciones relevantes de su sitio web.

Revise y seleccione páginas de la URL de su sitio web

Después de añadir la URL de un sitio web, puede revisar el mapa del sitio generado para esa fuente y ver qué páginas están asociadas a ella. Desde allí, puede seleccionar o deseleccionar páginas para controlar exactamente qué se incluye en su Centro de ayuda.

A medida que añade páginas, también puede supervisar el indicador de límite de caracteres para ver cuánto del límite de 120.000 caracteres está utilizando su Centro de ayuda.

capacityIndicator_Abovelimit (1).png

Cómo se extrae y limpia el contenido

Todo el contenido del sitio web pasa por un procesamiento de varias etapas para garantizar conocimiento de alta calidad.

CategoríaDetallesPropósito / Impacto
Qué se elimina
  • Menús de navegación
  • Encabezados y pies de página
  • Banners de cookies
  • Botones de “Volver arriba”
  • Anuncios
  • Imágenes y vídeos
  • Imágenes codificadas en Base64
  • Scripts y código malicioso
  • Ruido de formato y HTML redundante
Elimina elementos no esenciales y potencialmente inseguros para garantizar que solo se procese contenido relevante y limpio.
Qué se conserva
  • Encabezados
  • Párrafos
  • Listas
  • Contenido estructurado del artículo
Conserva contenido estructurado y significativo que contribuye a una recuperación precisa del conocimiento.
Por qué es importante
  • Mejora la precisión de las respuestas
  • Evita que el contenido irrelevante afecte a las respuestas
  • Reduce el procesamiento innecesario
  • Mejora la seguridad
  • Ayuda a la IA a recuperar información relevante de forma más eficaz
Garantiza respuestas de mayor calidad, mejor rendimiento y mayor fiabilidad del AI Voice Agent.

Expectativas sobre el tiempo de procesamiento

El tiempo de procesamiento depende del tamaño del rastreo.

  • De 1 a 10 páginas normalmente se procesan en menos de un minuto
  • Las secciones de tamaño medio pueden tardar entre 5 y 10 minutos
  • Los rastreos grandes a nivel raíz pueden tardar hasta 30 minutos

Si añade una URL de nivel superior como https://website.com/, es posible que se procesen muchas páginas enlazadas. Puede supervisar el progreso mediante el indicador de estado del documento.

Explicación de los límites de caracteres

Ventana de contexto del agente de voz

Su AI Voice Agent tiene una ventana de contexto de trabajo total de 120.000 caracteres. Esto incluye:

  • Contenido de sitio web rastreado
  • Preguntas frecuentes y entradas de texto libre
  • Todas las fuentes de conocimiento combinadas

Si el contenido total supera los 120.000 caracteres, se aplica una resumización automática antes de que el contenido sea utilizado por el agente de voz.

Importante: El límite de 120.000 caracteres es una limitación técnica necesaria para garantizar el rendimiento y la fiabilidad del sistema.

Prácticas recomendadas para la ingestión de sitios web

TemaRecomendaciónDetalles / Ejemplos
Empiece con URL específicasAñada páginas precisas con enlaces profundos en lugar de dominios raízEn lugar de https://website.com/, utilice una página específica como https://website.com/help/article-name. Cuanto más profunda sea la ruta de la URL, más específico será el rastreo.
Amplíe gradualmenteSuba un nivel de directorio cada vez si necesita una cobertura más ampliaPor ejemplo, pase de https://website.com/help/article-name a https://website.com/help/. Evite añadir la URL raíz a menos que realmente necesite contenido de todo el sitio.
Evite el rastreo excesivoNo empiece con URL de nivel raíz salvo que sea necesarioLas URL de nivel raíz pueden captar cientos de páginas, aumentar el tiempo de procesamiento, activar la resumización e introducir contenido irrelevante.
Utilice páginas de conocimiento estructuradasPriorice páginas bien organizadas y centradas en el contenidoLas fuentes con mejor rendimiento incluyen centros de ayuda, centros de documentación, secciones de preguntas frecuentes y artículos estructurados con encabezados claros.
Evite tipos de contenido no adecuadosExcluya páginas dinámicas, restringidas o no estructuradasEvite páginas que requieran inicio de sesión, páginas de resultados de búsqueda, contenido dinámico o basado en formularios, fuentes de noticias y páginas con mucho contenido multimedia.
Revise después del rastreoValide los resultados una vez finalizado el procesamientoRevise la vista previa del documento para asegurarse de que se hayan capturado las páginas correctas, de que no se hayan añadido URL duplicadas y de que el contenido esté estructurado correctamente. Puede actualizar el contenido del sitio web más adelante si la página de origen se actualiza.
Nota: Cuándo no rastrear: considere usar Preguntas frecuentes manuales o entrada de texto en su lugar si el contenido cambia con frecuencia:

• como noticias o datos en tiempo real;
• las páginas requieren autenticación;
• el sitio web se basa principalmente en vídeo o imágenes;
• o el contenido no está estructurado.