Centro de ayuda de Aircall | Uso de fuentes de conocimiento para tu Agente de Voz AI

Los Agentes de Voz AI de Aircall pueden aprender directamente de tu contenido público para ofrecer respuestas precisas, coherentes y alineadas con la marca durante las llamadas con clientes. Esto es posible gracias a las Fuentes de Conocimiento, que permiten que tu Agente AI consulte información confiable en tiempo real. Este artículo explica qué es una base de conocimientos, cómo beneficia a tu Agente AI y las limitaciones actuales que debes tener en cuenta.

¿Qué es una base de conocimientos?

Una base de conocimientos es una biblioteca centralizada de información sobre tu empresa, como productos, servicios y preguntas frecuentes. Ayuda a garantizar que la información sea fácil de encontrar, fácil de consultar y fácil de entender para tus Agentes AI.

Aircall utiliza el contenido que proporcionas, por ejemplo páginas web públicas o artículos de una integración conectada como Zendesk, para construir una base de conocimientos en la que tus Agentes AI puedan confiar durante las conversaciones con clientes.

Cómo las fuentes de conocimiento ayudan a tus Agentes AI

Una vez que tu contenido se añade como Fuente de Conocimiento, tu Agente AI puede:

Responder preguntas comunes utilizando información precisa y aprobada por la marca
Mantener un mensaje coherente en todas las llamadas
Reducir respuestas manuales repetitivas
Consultar tu contenido al instante durante las interacciones con clientes

Esto garantiza que los llamantes reciban respuestas precisas y útiles basadas directamente en tu propia información publicada.

Tipos de contenido compatibles

Puedes añadir nuevas Fuentes de Conocimiento de las siguientes maneras:

Bloque de contenido: Pega cualquier texto plano del que quieras que el agente aprenda
Página web: Añade una URL pública única
Sitio web: Añade un dominio público principal, con subpáginas opcionales
Fuentes existentes: Reutiliza o actualiza contenido que ya hayas añadido
Fuentes de terceros: Conecta una integración como Zendesk y selecciona los artículos específicos de los que quieres que tu agente aprenda.

Nota: Las fuentes de texto y sitios web deben estar disponibles públicamente. Las fuentes de terceros se incorporan de manera segura a través de tu integración conectada y pueden incluir contenido que no es accesible públicamente.

Añadir una fuente de conocimiento desde una integración de terceros

Además de las fuentes de texto y sitios web, puedes conectar una integración de terceros para incorporar contenido directamente desde las herramientas que ya usas. Actualmente, esto está disponible solo para Zendesk. Esto significa que tu agente aprende de los mismos artículos que tu equipo ya mantiene, sin necesidad de duplicarlos.

Pasos

En la pantalla de Fuente de conocimiento, selecciona Añadir fuente.
En el panel Añadir fuente, desplázate hasta Fuentes de terceros y selecciona una integración, por ejemplo Zendesk.
Navega por los artículos disponibles en esa integración. Usa el campo de búsqueda para encontrar artículos específicos y marca los que quieras incluir. Un indicador muestra cuántos artículos has seleccionado.
Selecciona Añadir fuente para confirmar. Los artículos seleccionados se procesan y añaden a tu base de conocimientos.

Los artículos seleccionados cuentan para tu capacidad total de contenido y se tratan igual que cualquier otra fuente de conocimiento. Si la integración que necesitas no aparece, puedes conectarla desde la sección de integraciones enlazada en el panel.

Nota: El soporte para Salesforce y otras integraciones llegará pronto.

Limitaciones actuales

Para asegurar los mejores resultados, ten en cuenta las siguientes limitaciones.

Páginas con acceso restringido o que requieren autenticación

No se puede procesar contenido añadido por URL o rastreo de sitios web desde:

Páginas que requieren inicio de sesión
Áreas protegidas con contraseña
Portales internos o paneles de control
Páginas detrás de muros de pago

Solo se admiten URLs públicas para fuentes de sitios web. Si necesitas incluir contenido que está detrás de un inicio de sesión, utiliza una integración de terceros cuando esté disponible.

Contenido solo en imágenes

Si la información importante aparece solo en imágenes, como texto incrustado en imágenes, diagramas o capturas de pantalla, puede que no sea legible ni utilizable por el Agente AI.

Subida de documentos aún no soportada

Actualmente no puedes subir archivos como:

PDFs
Documentos de Word
Hojas de cálculo

Importante: El soporte para la subida de documentos está planeado para una versión futura.

Gestión de FAQs y rastreo de sitios web en tu Base de Conocimientos

Tu FAQ existente y el contenido nuevo de sitios web pueden trabajar juntos sin problemas en tu Base de Conocimientos. Este artículo explica cómo se gestionan las FAQs, cómo funciona el rastreo de sitios web, cómo se procesa el contenido y qué límites se aplican a tu Agente de Voz AI.

¿Qué ocurre con mi FAQ existente?

No necesitas eliminar ni modificar tu FAQ actual. Tu FAQ actual se guarda automáticamente como FAQ de [Nombre del Agente], y tu Agente de Voz AI sigue usándola como fuente de conocimiento. Puedes combinar múltiples tipos de fuentes de conocimiento, incluyendo:

Entradas de FAQ o texto abierto
URLs individuales
Sitios web rastreados
Artículos de integraciones de terceros como Zendesk

Todas las fuentes de conocimiento se tratan por igual. Actualmente no hay priorización ni ponderación entre diferentes fuentes.

Cómo funciona el rastreo de sitios web

Cuando añades una URL de sitio web a tu Base de Conocimientos, Aircall procesa automáticamente:

La página que proporcionas
Las páginas a las que enlaza
Las páginas a las que hacen referencia esas páginas enlazadas

Esto aplica solo si las URLs comparten el mismo prefijo.

Profundidad del rastreo

Rastrearemos:

La página proporcionada
Hasta dos niveles más profundos
Solo si las URLs comparten el mismo prefijo

Ejemplo

Si añades: https://website.com/depth1/

También podemos rastrear:

https://website.com/depth1/depth2
https://website.com/depth1/depth2/depth3

No rastrearemos secciones no relacionadas como:

https://website.com/blog
https://website.com/contact

Esto asegura que solo se incluyan secciones relevantes de tu sitio web.

Revisar y seleccionar páginas desde tu URL de sitio web

Después de añadir una URL de sitio web, puedes revisar el mapa del sitio generado para esa fuente y ver qué páginas están asociadas. Desde ahí, puedes seleccionar o deseleccionar páginas para controlar exactamente qué se incluye en tu Base de Conocimientos.

A medida que añades páginas, también puedes monitorizar el indicador de límite de caracteres para ver cuánto de los 120.000 caracteres permitidos está usando tu Base de Conocimientos.

Cómo se extrae y limpia el contenido

Todo el contenido web pasa por un procesamiento en varias etapas para asegurar un conocimiento de alta calidad.

Categoría	Detalles	Propósito / Impacto
Qué se elimina	Menús de navegación Encabezados y pies de página Banners de cookies Botones de "Volver arriba" Anuncios Imágenes y vídeos Imágenes codificadas en Base64 Scripts y código malicioso Ruido de formato y HTML redundante	Elimina elementos no esenciales y potencialmente inseguros para asegurar que solo se procese contenido relevante y limpio.
Qué se conserva	Encabezados Párrafos Listas Contenido estructurado del artículo	Preserva contenido estructurado y significativo que contribuye a una recuperación de conocimiento precisa.
Por qué es importante	Mejora la precisión de las respuestas Evita que contenido irrelevante afecte las respuestas Reduce el procesamiento innecesario Aumenta la seguridad Ayuda a la IA a recuperar información relevante de manera más efectiva	Asegura respuestas de mayor calidad, mejor rendimiento y mayor fiabilidad del Agente de Voz AI.

Expectativas sobre el tiempo de procesamiento

El tiempo de procesamiento depende del tamaño del rastreo.

De 1 a 10 páginas se procesan normalmente en menos de un minuto
Secciones de tamaño medio pueden tardar entre 5 y 10 minutos
Rastreo de nivel raíz grande puede tardar hasta 30 minutos

Si añades una URL de nivel superior como https://website.com/, muchas páginas enlazadas pueden procesarse. Puedes monitorizar el progreso usando el indicador de estado del documento.

Explicación de los límites de caracteres

Ventana de contexto del Agente de Voz

Tu Agente de Voz AI tiene una ventana de contexto total de trabajo de 120.000 caracteres. Esto incluye:

Contenido rastreado de sitios web
Entradas de FAQ y texto abierto
Artículos añadidos desde integraciones de terceros
Todas las fuentes de conocimiento combinadas

Si el contenido total supera los 120.000 caracteres, se aplica un resumen automático antes de que el contenido sea usado por el Agente de Voz.

Importante: El límite de 120.000 caracteres es una limitación técnica necesaria para asegurar el rendimiento y la fiabilidad del sistema.

Buenas prácticas para la ingestión de sitios web

Tema	Recomendación	Detalles / Ejemplos
Comienza con URLs específicas	Añade páginas precisas y con enlaces profundos en lugar de dominios raíz	En lugar de `https://website.com/`, usa una página dirigida como `https://website.com/help/article-name`. Cuanto más profundo sea el camino de la URL, más dirigido será el rastreo.
Expande gradualmente	Sube un nivel de directorio a la vez si necesitas una cobertura más amplia	Por ejemplo, pasa de `https://website.com/help/article-name` a `https://website.com/help/`. Evita añadir la URL raíz a menos que realmente necesites contenido de todo el sitio.
Evita el rastreo excesivo	No comiences con URLs de nivel raíz a menos que sea necesario	Las URLs de nivel raíz pueden capturar cientos de páginas, aumentar el tiempo de procesamiento, activar resúmenes y añadir contenido irrelevante.
Usa páginas de conocimiento estructurado	Prioriza páginas bien organizadas y centradas en contenido	Las fuentes con mejor rendimiento incluyen centros de ayuda, hubs de documentación, secciones de FAQ y artículos estructurados con encabezados claros.
Evita tipos de contenido no adecuados	Excluye páginas que sean dinámicas, restringidas o no estructuradas	Evita páginas que requieran inicio de sesión, páginas de resultados de búsqueda, contenido dinámico o basado en formularios, fuentes de noticias y páginas con mucho contenido multimedia. Para contenido detrás de un inicio de sesión, usa una integración de terceros en su lugar.
Revisa tras el rastreo	Valida los resultados una vez completado el procesamiento	Revisa la vista previa del documento para asegurarte de que se capturaron las páginas correctas, no se añadieron URLs duplicadas y el contenido está estructurado correctamente. Puedes actualizar el contenido web más tarde si la página fuente cambia.

Nota: Cuándo no rastrear - considera usar FAQ manual o entrada de texto en su lugar si el contenido cambia con frecuencia:

• como noticias o datos en tiempo real;
• las páginas requieren autenticación;
• el sitio web es principalmente basado en vídeo o imágenes;
• o el contenido no está estructurado.

¿Qué es una base de conocimientos?

Cómo las fuentes de conocimiento ayudan a tus Agentes AI

Una vez que tu contenido se añade como Fuente de Conocimiento, tu Agente AI puede:

Responder preguntas comunes utilizando información precisa y aprobada por la marca
Mantener un mensaje coherente en todas las llamadas
Reducir respuestas manuales repetitivas
Consultar tu contenido al instante durante las interacciones con clientes

Esto garantiza que los llamantes reciban respuestas precisas y útiles basadas directamente en tu propia información publicada.

Tipos de contenido compatibles

Puedes añadir nuevas Fuentes de Conocimiento de las siguientes maneras:

Bloque de contenido: Pega cualquier texto plano del que quieras que el agente aprenda
Página web: Añade una URL pública única
Sitio web: Añade un dominio público principal, con subpáginas opcionales
Fuentes existentes: Reutiliza o actualiza contenido que ya hayas añadido
Fuentes de terceros: Conecta una integración como Zendesk y selecciona los artículos específicos de los que quieres que tu agente aprenda.

Nota: Las fuentes de texto y sitios web deben estar disponibles públicamente. Las fuentes de terceros se incorporan de manera segura a través de tu integración conectada y pueden incluir contenido que no es accesible públicamente.

Añadir una fuente de conocimiento desde una integración de terceros

Pasos

En la pantalla de Fuente de conocimiento, selecciona Añadir fuente.
En el panel Añadir fuente, desplázate hasta Fuentes de terceros y selecciona una integración, por ejemplo Zendesk.
Navega por los artículos disponibles en esa integración. Usa el campo de búsqueda para encontrar artículos específicos y marca los que quieras incluir. Un indicador muestra cuántos artículos has seleccionado.
Selecciona Añadir fuente para confirmar. Los artículos seleccionados se procesan y añaden a tu base de conocimientos.

Nota: El soporte para Salesforce y otras integraciones llegará pronto.

Limitaciones actuales

Para asegurar los mejores resultados, ten en cuenta las siguientes limitaciones.

Páginas con acceso restringido o que requieren autenticación

No se puede procesar contenido añadido por URL o rastreo de sitios web desde:

Páginas que requieren inicio de sesión
Áreas protegidas con contraseña
Portales internos o paneles de control
Páginas detrás de muros de pago

Solo se admiten URLs públicas para fuentes de sitios web. Si necesitas incluir contenido que está detrás de un inicio de sesión, utiliza una integración de terceros cuando esté disponible.

Contenido solo en imágenes

Si la información importante aparece solo en imágenes, como texto incrustado en imágenes, diagramas o capturas de pantalla, puede que no sea legible ni utilizable por el Agente AI.

Subida de documentos aún no soportada

Actualmente no puedes subir archivos como:

PDFs
Documentos de Word
Hojas de cálculo

Importante: El soporte para la subida de documentos está planeado para una versión futura.

Gestión de FAQs y rastreo de sitios web en tu Base de Conocimientos

¿Qué ocurre con mi FAQ existente?

Entradas de FAQ o texto abierto
URLs individuales
Sitios web rastreados
Artículos de integraciones de terceros como Zendesk

Todas las fuentes de conocimiento se tratan por igual. Actualmente no hay priorización ni ponderación entre diferentes fuentes.

Cómo funciona el rastreo de sitios web

Cuando añades una URL de sitio web a tu Base de Conocimientos, Aircall procesa automáticamente:

La página que proporcionas
Las páginas a las que enlaza
Las páginas a las que hacen referencia esas páginas enlazadas

Esto aplica solo si las URLs comparten el mismo prefijo.

Profundidad del rastreo

Rastrearemos:

La página proporcionada
Hasta dos niveles más profundos
Solo si las URLs comparten el mismo prefijo

Ejemplo

Si añades: https://website.com/depth1/

También podemos rastrear:

https://website.com/depth1/depth2
https://website.com/depth1/depth2/depth3

No rastrearemos secciones no relacionadas como:

https://website.com/blog
https://website.com/contact

Esto asegura que solo se incluyan secciones relevantes de tu sitio web.

Revisar y seleccionar páginas desde tu URL de sitio web

A medida que añades páginas, también puedes monitorizar el indicador de límite de caracteres para ver cuánto de los 120.000 caracteres permitidos está usando tu Base de Conocimientos.

Cómo se extrae y limpia el contenido

Todo el contenido web pasa por un procesamiento en varias etapas para asegurar un conocimiento de alta calidad.

Categoría	Detalles	Propósito / Impacto
Qué se elimina	Menús de navegación Encabezados y pies de página Banners de cookies Botones de "Volver arriba" Anuncios Imágenes y vídeos Imágenes codificadas en Base64 Scripts y código malicioso Ruido de formato y HTML redundante	Elimina elementos no esenciales y potencialmente inseguros para asegurar que solo se procese contenido relevante y limpio.
Qué se conserva	Encabezados Párrafos Listas Contenido estructurado del artículo	Preserva contenido estructurado y significativo que contribuye a una recuperación de conocimiento precisa.
Por qué es importante	Mejora la precisión de las respuestas Evita que contenido irrelevante afecte las respuestas Reduce el procesamiento innecesario Aumenta la seguridad Ayuda a la IA a recuperar información relevante de manera más efectiva	Asegura respuestas de mayor calidad, mejor rendimiento y mayor fiabilidad del Agente de Voz AI.

Expectativas sobre el tiempo de procesamiento

El tiempo de procesamiento depende del tamaño del rastreo.

De 1 a 10 páginas se procesan normalmente en menos de un minuto
Secciones de tamaño medio pueden tardar entre 5 y 10 minutos
Rastreo de nivel raíz grande puede tardar hasta 30 minutos

Si añades una URL de nivel superior como https://website.com/, muchas páginas enlazadas pueden procesarse. Puedes monitorizar el progreso usando el indicador de estado del documento.

Explicación de los límites de caracteres

Ventana de contexto del Agente de Voz

Tu Agente de Voz AI tiene una ventana de contexto total de trabajo de 120.000 caracteres. Esto incluye:

Contenido rastreado de sitios web
Entradas de FAQ y texto abierto
Artículos añadidos desde integraciones de terceros
Todas las fuentes de conocimiento combinadas

Si el contenido total supera los 120.000 caracteres, se aplica un resumen automático antes de que el contenido sea usado por el Agente de Voz.

Importante: El límite de 120.000 caracteres es una limitación técnica necesaria para asegurar el rendimiento y la fiabilidad del sistema.

Buenas prácticas para la ingestión de sitios web

Tema	Recomendación	Detalles / Ejemplos
Comienza con URLs específicas	Añade páginas precisas y con enlaces profundos en lugar de dominios raíz	En lugar de `https://website.com/`, usa una página dirigida como `https://website.com/help/article-name`. Cuanto más profundo sea el camino de la URL, más dirigido será el rastreo.
Expande gradualmente	Sube un nivel de directorio a la vez si necesitas una cobertura más amplia	Por ejemplo, pasa de `https://website.com/help/article-name` a `https://website.com/help/`. Evita añadir la URL raíz a menos que realmente necesites contenido de todo el sitio.
Evita el rastreo excesivo	No comiences con URLs de nivel raíz a menos que sea necesario	Las URLs de nivel raíz pueden capturar cientos de páginas, aumentar el tiempo de procesamiento, activar resúmenes y añadir contenido irrelevante.
Usa páginas de conocimiento estructurado	Prioriza páginas bien organizadas y centradas en contenido	Las fuentes con mejor rendimiento incluyen centros de ayuda, hubs de documentación, secciones de FAQ y artículos estructurados con encabezados claros.
Evita tipos de contenido no adecuados	Excluye páginas que sean dinámicas, restringidas o no estructuradas	Evita páginas que requieran inicio de sesión, páginas de resultados de búsqueda, contenido dinámico o basado en formularios, fuentes de noticias y páginas con mucho contenido multimedia. Para contenido detrás de un inicio de sesión, usa una integración de terceros en su lugar.
Revisa tras el rastreo	Valida los resultados una vez completado el procesamiento	Revisa la vista previa del documento para asegurarte de que se capturaron las páginas correctas, no se añadieron URLs duplicadas y el contenido está estructurado correctamente. Puedes actualizar el contenido web más tarde si la página fuente cambia.

Nota: Cuándo no rastrear - considera usar FAQ manual o entrada de texto en su lugar si el contenido cambia con frecuencia:

• como noticias o datos en tiempo real;
• las páginas requieren autenticación;
• el sitio web es principalmente basado en vídeo o imágenes;
• o el contenido no está estructurado.