Les Agents Vocaux IA d’Aircall peuvent apprendre directement à partir de votre contenu public afin de fournir des réponses précises, cohérentes et conformes à votre marque lors des appels clients. Ceci est rendu possible grâce aux Sources de Connaissances, qui permettent à votre Agent IA de se référer à des informations fiables en temps réel. Cet article explique ce qu’est une base de connaissances, ses avantages pour votre Agent IA, ainsi que les limitations actuelles à connaître.

Qu’est-ce qu’une base de connaissances ?

Une base de connaissances est une bibliothèque centralisée d’informations sur votre entreprise, telles que les produits, services et questions fréquemment posées. Elle permet de s’assurer que l’information est facile à trouver, à référencer et à comprendre pour vos Agents IA.

Aircall utilise le contenu que vous fournissez, par exemple des pages web publiques, pour construire une base de connaissances sur laquelle vos Agents IA peuvent s’appuyer lors des conversations avec les clients.

Comment les sources de connaissances aident vos Agents IA

Une fois votre contenu ajouté en tant que Source de Connaissance, votre Agent IA peut :

  • Répondre aux questions courantes à l’aide d’informations précises et approuvées par la marque
  • Maintenir un message cohérent lors des appels
  • Réduire les réponses manuelles répétitives
  • Se référer instantanément à votre contenu lors des interactions avec les clients

Cela garantit que les appelants reçoivent des réponses précises et utiles, directement basées sur vos propres informations publiées.

Types de contenus pris en charge

Vous pouvez ajouter de nouvelles Sources de Connaissances de la manière suivante :

  • Bloc de contenu : Collez tout texte brut que vous souhaitez que l’agent apprenne
  • Page web : Ajoutez une URL publique unique
  • Site web : Ajoutez un domaine public principal, avec des sous-pages en option
  • Sources existantes : Réutilisez ou mettez à jour du contenu déjà ajouté

Screenshot 2025-12-16 at 09.41.45.png

Remarque: Tout contenu ajouté en tant que Source de Connaissance doit être publiquement accessible.

Limitations actuelles

Pour garantir les meilleurs résultats, veuillez noter les limitations suivantes.

Pages protégées ou nécessitant une authentification

Les Sources de Connaissances ne peuvent pas ingérer du contenu provenant de :

  • Pages nécessitant une connexion
  • Zones protégées par mot de passe
  • Portails ou tableaux de bord internes
  • Pages derrière un paywall

Seules les URLs publiques sont prises en charge.

Contenu composé uniquement d’images

Si des informations importantes apparaissent uniquement sous forme d’images, comme du texte intégré dans des images, des schémas ou des captures d’écran, elles peuvent ne pas être lisibles ou utilisables par l’Agent IA.

Téléversement de documents non encore pris en charge

Vous ne pouvez actuellement pas téléverser de fichiers tels que :

  • PDF
  • Documents Word
  • Tableurs
Important: La prise en charge du téléversement de documents est prévue dans une future version.

Gestion des FAQ et de l’exploration de site web dans votre Base de Connaissances

Votre FAQ existante et le contenu de site web nouvellement ajouté peuvent fonctionner ensemble de manière transparente dans votre Base de Connaissances. Cet article explique comment les FAQ sont gérées, comment fonctionne l’exploration de site web, comment le contenu est traité et quelles limites s’appliquent à votre Agent Vocal IA.

Que devient ma FAQ existante ?

Vous n’avez pas besoin de supprimer ou de modifier votre FAQ existante. Votre FAQ actuelle est automatiquement enregistrée en tant que FAQ de [Nom de l’Agent], et votre Agent Vocal IA continue de l’utiliser comme source de connaissances. Vous pouvez combiner plusieurs types de sources de connaissances, y compris :

  • FAQ ou entrées en texte libre
  • URLs individuelles
  • Sites web explorés

Toutes les sources de connaissances sont traitées de la même manière. Il n’y a actuellement aucune priorisation ou pondération entre les différentes sources.

Comment fonctionne l’exploration de site web

Lorsque vous ajoutez une URL de site web à votre Base de Connaissances, Aircall traite automatiquement :

  • La page que vous fournissez
  • Les pages auxquelles elle renvoie
  • Les pages référencées par ces pages liées

Cela s’applique uniquement si les URLs partagent le même préfixe.

Profondeur d’exploration

Nous explorons :

  • La page fournie
  • Jusqu’à deux niveaux supplémentaires
  • Uniquement si les URLs partagent le même préfixe

Exemple

Si vous ajoutez : https://website.com/depth1/

Nous pouvons également explorer :

  • https://website.com/depth1/depth2
  • https://website.com/depth1/depth2/depth3

Nous n’explorerons pas les sections non liées telles que :

  • https://website.com/blog
  • https://website.com/contact

Cela garantit que seules les sections pertinentes de votre site web sont incluses.

Comment le contenu est extrait et nettoyé

Tout le contenu du site web passe par un traitement en plusieurs étapes pour garantir une connaissance de haute qualité.

CatégorieDétailsBut / Impact
Ce qui est supprimé
  • Menus de navigation
  • En-têtes et pieds de page
  • Bannières de cookies
  • Boutons « Retour en haut »
  • Publicités
  • Images et vidéos
  • Images encodées en Base64
  • Scripts et code malveillant
  • Bruit de mise en forme et HTML redondant
Supprime les éléments non essentiels et potentiellement dangereux afin de garantir que seul le contenu pertinent et propre soit traité.
Ce qui est conservé
  • Titres
  • Paragraphes
  • Listes
  • Contenu d’article structuré
Préserve le contenu structuré et pertinent qui contribue à une récupération précise des connaissances.
Pourquoi c’est important
  • Améliore la précision des réponses
  • Prévient l’impact du contenu non pertinent sur les réponses
  • Réduit le traitement inutile
  • Renforce la sécurité
  • Aide l’IA à retrouver plus efficacement les informations pertinentes
Garantit des réponses de meilleure qualité, de meilleures performances et une fiabilité accrue de l’Agent Vocal IA.

Délais de traitement attendus

Le délai de traitement dépend de la taille de l’exploration.

  • 1 à 10 pages sont généralement traitées en moins d’une minute
  • Les sections de taille moyenne peuvent prendre 5 à 10 minutes
  • Les explorations de niveau racine importantes peuvent prendre jusqu’à 30 minutes

Si vous ajoutez une URL de niveau supérieur telle que https://website.com/, de nombreuses pages liées peuvent être traitées. Vous pouvez suivre la progression à l’aide de l’indicateur de statut du document.

Explication des limites de caractères

Fenêtre de contexte de l’Agent Vocal

Votre Agent Vocal IA dispose d’une fenêtre de contexte de travail totale de 120 000 caractères. Cela inclut :

  • Contenu de site web exploré
  • FAQ et entrées en texte libre
  • Toutes les sources de connaissances combinées

Si le contenu total dépasse 120 000 caractères, une synthèse automatique est appliquée avant que le contenu ne soit utilisé par l’Agent Vocal.

Important: La limite de 120 000 caractères est une contrainte technique nécessaire pour garantir la performance et la fiabilité du système.

Bonnes pratiques pour l’ingestion de site web

SujetRecommandationDétails / Exemples
Commencez par des URLs spécifiquesAjoutez des pages précises et profondes plutôt que des domaines racineAu lieu de https://website.com/, utilisez une page ciblée telle que https://website.com/help/article-name. Plus le chemin de l’URL est profond, plus l’exploration est ciblée.
Élargissez progressivementMontez d’un niveau de répertoire à la fois si une couverture plus large est nécessairePar exemple, passez de https://website.com/help/article-name à https://website.com/help/. Évitez d’ajouter l’URL racine sauf si vous avez réellement besoin du contenu de l’ensemble du site.
Évitez la surexplorationNe commencez pas par des URLs de niveau racine sauf nécessitéLes URLs de niveau racine peuvent inclure des centaines de pages, augmenter le temps de traitement, déclencher la synthèse et introduire du contenu non pertinent.
Utilisez des pages de connaissances structuréesPrivilégiez les pages bien organisées et axées sur le contenuLes sources les plus performantes incluent les centres d’aide, hubs de documentation, sections FAQ et articles structurés avec des titres clairs.
Évitez les types de contenu inadaptésExcluez les pages dynamiques, restreintes ou non structuréesÉvitez les pages nécessitant une connexion, les pages de résultats de recherche, le contenu dynamique ou basé sur des formulaires, les flux d’actualités et les pages riches en médias.
Vérifiez après l’explorationValidez les résultats une fois le traitement terminéVérifiez l’aperçu du document pour vous assurer que les bonnes pages ont été capturées, qu’aucune URL dupliquée n’a été ajoutée et que le contenu est correctement structuré. Vous pouvez actualiser le contenu du site ultérieurement si la page source est mise à jour.
Remarque: Quand ne pas explorer – envisagez d’utiliser une FAQ manuelle ou une saisie de texte si le contenu change fréquemment :

• comme les actualités ou les données en temps réel ;
• les pages nécessitent une authentification ;
• le site web est principalement composé de vidéos ou d’images ;
• ou le contenu est non structuré.