Les Agents Vocaux IA d’Aircall peuvent apprendre directement à partir de votre contenu public afin de fournir des réponses précises, cohérentes et conformes à votre marque lors des appels clients. Ceci est rendu possible grâce aux Sources de Connaissances, qui permettent à votre Agent IA de se référer à des informations fiables en temps réel. Cet article explique ce qu’est une base de connaissances, ses avantages pour votre Agent IA, ainsi que les limitations actuelles à connaître.
Qu’est-ce qu’une base de connaissances ?
Une base de connaissances est une bibliothèque centralisée d’informations sur votre entreprise, telles que les produits, services et questions fréquemment posées. Elle permet de s’assurer que l’information est facile à trouver, à référencer et à comprendre pour vos Agents IA.
Aircall utilise le contenu que vous fournissez, par exemple des pages web publiques, pour construire une base de connaissances sur laquelle vos Agents IA peuvent s’appuyer lors des conversations avec les clients.
Comment les sources de connaissances aident vos Agents IA
Une fois votre contenu ajouté en tant que Source de Connaissance, votre Agent IA peut :
- Répondre aux questions courantes à l’aide d’informations précises et approuvées par la marque
- Maintenir un message cohérent lors des appels
- Réduire les réponses manuelles répétitives
- Se référer instantanément à votre contenu lors des interactions avec les clients
Cela garantit que les appelants reçoivent des réponses précises et utiles, directement basées sur vos propres informations publiées.
Types de contenus pris en charge
Vous pouvez ajouter de nouvelles Sources de Connaissances de la manière suivante :
- Bloc de contenu : Collez tout texte brut que vous souhaitez que l’agent apprenne
- Page web : Ajoutez une URL publique unique
- Site web : Ajoutez un domaine public principal, avec des sous-pages en option
- Sources existantes : Réutilisez ou mettez à jour du contenu déjà ajouté
Remarque: Tout contenu ajouté en tant que Source de Connaissance doit être publiquement accessible.
Limitations actuelles
Pour garantir les meilleurs résultats, veuillez noter les limitations suivantes.
Pages protégées ou nécessitant une authentification
Les Sources de Connaissances ne peuvent pas ingérer du contenu provenant de :
- Pages nécessitant une connexion
- Zones protégées par mot de passe
- Portails ou tableaux de bord internes
- Pages derrière un paywall
Seules les URLs publiques sont prises en charge.
Contenu composé uniquement d’images
Si des informations importantes apparaissent uniquement sous forme d’images, comme du texte intégré dans des images, des schémas ou des captures d’écran, elles peuvent ne pas être lisibles ou utilisables par l’Agent IA.
Téléversement de documents non encore pris en charge
Vous ne pouvez actuellement pas téléverser de fichiers tels que :
- Documents Word
- Tableurs
Important: La prise en charge du téléversement de documents est prévue dans une future version.
Gestion des FAQ et de l’exploration de site web dans votre Base de Connaissances
Votre FAQ existante et le contenu de site web nouvellement ajouté peuvent fonctionner ensemble de manière transparente dans votre Base de Connaissances. Cet article explique comment les FAQ sont gérées, comment fonctionne l’exploration de site web, comment le contenu est traité et quelles limites s’appliquent à votre Agent Vocal IA.
Que devient ma FAQ existante ?
Vous n’avez pas besoin de supprimer ou de modifier votre FAQ existante. Votre FAQ actuelle est automatiquement enregistrée en tant que FAQ de [Nom de l’Agent], et votre Agent Vocal IA continue de l’utiliser comme source de connaissances. Vous pouvez combiner plusieurs types de sources de connaissances, y compris :
- FAQ ou entrées en texte libre
- URLs individuelles
- Sites web explorés
Toutes les sources de connaissances sont traitées de la même manière. Il n’y a actuellement aucune priorisation ou pondération entre les différentes sources.
Comment fonctionne l’exploration de site web
Lorsque vous ajoutez une URL de site web à votre Base de Connaissances, Aircall traite automatiquement :
- La page que vous fournissez
- Les pages auxquelles elle renvoie
- Les pages référencées par ces pages liées
Cela s’applique uniquement si les URLs partagent le même préfixe.
Profondeur d’exploration
Nous explorons :
- La page fournie
- Jusqu’à deux niveaux supplémentaires
- Uniquement si les URLs partagent le même préfixe
Exemple
Si vous ajoutez : https://website.com/depth1/
Nous pouvons également explorer :
https://website.com/depth1/depth2https://website.com/depth1/depth2/depth3
Nous n’explorerons pas les sections non liées telles que :
https://website.com/bloghttps://website.com/contact
Cela garantit que seules les sections pertinentes de votre site web sont incluses.
Comment le contenu est extrait et nettoyé
Tout le contenu du site web passe par un traitement en plusieurs étapes pour garantir une connaissance de haute qualité.
| Catégorie | Détails | But / Impact |
|---|---|---|
| Ce qui est supprimé |
| Supprime les éléments non essentiels et potentiellement dangereux afin de garantir que seul le contenu pertinent et propre soit traité. |
| Ce qui est conservé |
| Préserve le contenu structuré et pertinent qui contribue à une récupération précise des connaissances. |
| Pourquoi c’est important |
| Garantit des réponses de meilleure qualité, de meilleures performances et une fiabilité accrue de l’Agent Vocal IA. |
Délais de traitement attendus
Le délai de traitement dépend de la taille de l’exploration.
- 1 à 10 pages sont généralement traitées en moins d’une minute
- Les sections de taille moyenne peuvent prendre 5 à 10 minutes
- Les explorations de niveau racine importantes peuvent prendre jusqu’à 30 minutes
Si vous ajoutez une URL de niveau supérieur telle que https://website.com/, de nombreuses pages liées peuvent être traitées. Vous pouvez suivre la progression à l’aide de l’indicateur de statut du document.
Explication des limites de caractères
Fenêtre de contexte de l’Agent Vocal
Votre Agent Vocal IA dispose d’une fenêtre de contexte de travail totale de 120 000 caractères. Cela inclut :
- Contenu de site web exploré
- FAQ et entrées en texte libre
- Toutes les sources de connaissances combinées
Si le contenu total dépasse 120 000 caractères, une synthèse automatique est appliquée avant que le contenu ne soit utilisé par l’Agent Vocal.
Important: La limite de 120 000 caractères est une contrainte technique nécessaire pour garantir la performance et la fiabilité du système.
Bonnes pratiques pour l’ingestion de site web
| Sujet | Recommandation | Détails / Exemples |
|---|---|---|
| Commencez par des URLs spécifiques | Ajoutez des pages précises et profondes plutôt que des domaines racine | Au lieu de https://website.com/, utilisez une page ciblée telle que https://website.com/help/article-name. Plus le chemin de l’URL est profond, plus l’exploration est ciblée. |
| Élargissez progressivement | Montez d’un niveau de répertoire à la fois si une couverture plus large est nécessaire | Par exemple, passez de https://website.com/help/article-name à https://website.com/help/. Évitez d’ajouter l’URL racine sauf si vous avez réellement besoin du contenu de l’ensemble du site. |
| Évitez la surexploration | Ne commencez pas par des URLs de niveau racine sauf nécessité | Les URLs de niveau racine peuvent inclure des centaines de pages, augmenter le temps de traitement, déclencher la synthèse et introduire du contenu non pertinent. |
| Utilisez des pages de connaissances structurées | Privilégiez les pages bien organisées et axées sur le contenu | Les sources les plus performantes incluent les centres d’aide, hubs de documentation, sections FAQ et articles structurés avec des titres clairs. |
| Évitez les types de contenu inadaptés | Excluez les pages dynamiques, restreintes ou non structurées | Évitez les pages nécessitant une connexion, les pages de résultats de recherche, le contenu dynamique ou basé sur des formulaires, les flux d’actualités et les pages riches en médias. |
| Vérifiez après l’exploration | Validez les résultats une fois le traitement terminé | Vérifiez l’aperçu du document pour vous assurer que les bonnes pages ont été capturées, qu’aucune URL dupliquée n’a été ajoutée et que le contenu est correctement structuré. Vous pouvez actualiser le contenu du site ultérieurement si la page source est mise à jour. |
Remarque: Quand ne pas explorer – envisagez d’utiliser une FAQ manuelle ou une saisie de texte si le contenu change fréquemment :
• comme les actualités ou les données en temps réel ;
• les pages nécessitent une authentification ;
• le site web est principalement composé de vidéos ou d’images ;
• ou le contenu est non structuré.