Crée ton premier agent IA vocal

À la une : Claude 3.7 Sonnet, le nouveau champion du code

Au menu d’aujourd’hui :

  • 🎤 Crée ton premier agent IA vocal

  • 🗞️ À la une : Claude 3.7 Sonnet, le nouveau champion du code

  • 📮 6 autres news en bref

  • 💎 4 ressources de la semaine

🎓 Le tutoriel du jour

À la fin du tutoriel tu sauras comment créer un agent IA vocal qui peut communiquer dans la langue de ton choix à partir d’instructions et d’une base de connaissances.

Time a ajouté la possibilité de poser des questions à l’oral sur les articles des “Person of the Year”, comme ici sur le POY 2022.

Objectif du tutoriel

On se met dans la peau du responsable marketing de la scaleup lyonnaise Agicap qui vend un SaaS de prévisionnel de trésorerie.

On veut ajouter un agent vocal sur le blog capable de répondre aux questions des visiteurs sur les articles les plus longs.

On peut imaginer placer ce widget dans l’en-tête de certains articles comme celui-ci où le temps de lecture estimé est de 13 minutes.

Cas d’usage

  • 📣 Marketing : Proposer un assistant vocal qui guide les visiteurs vers les articles les plus pertinents en fonction de leurs questions.

  • 📞 Sales : Qualifier les leads en identifiant leurs besoins avant de les rediriger vers un commercial.

  • 🧡 Service Client : Fournir une assistance instantanée sur les produits ou services mentionnés dans les articles.

  • 🤗 RH : Créer un module de FAQ interactif pour répondre aux questions des candidats sur les offres d’emploi.

Outils utilisés

Étape 1 : Crée un agent vocal

Rends-toi sur ton tableau de bord ElevenLabs, sélectionne l’onglet « Agents » et clique sur le bouton « + ».

Un panneau apparaîtra à droite. Commence par donner un nom à ton agent, puis sélectionne « Blank template » en dessous.

Tu peux maintenant commencer à construire ton agent. Voici les champs clés.

Langue de l’agent

ElevenLabs peut gérer des dizaines de langues. Dans notre cas, on choisit le français comme langue par défaut.

Tu peux ajouter des langues additionnelles si ton agent doit pouvoir communiquer dans plusieurs langues.

Premier message

Lorsqu’une personne active ton agent, c’est lui qui parle en premier, et c’est ici que tu configures ce premier message.

On choisit un message simple

System prompt

C’est ici que tu indiques à l’agent son objectif global. Cela l’aidera à orienter ses réponses.

Essaye de rester simple pour ne pas surcharger inutilement la “context window” de ton LLM.

LLM

En arrière-plan, ElevenLabs se connecte à un LLM pour traiter les messages entrants et générer des réponses. Nous utiliserons « Gemini 1.5 Flash » car il est le plus rapide.

💡 À noter : Tu peux aussi connecter un autre LLM qui n’est pas dans la liste avec ta clé API. Veille à choisir un modèle avec une bonne latence.

Étape 2 : Ajoute l’article en question dans ta base de connaissance

Dans l’encadré « Base de connaissances », clique sur « Ajouter un élément ».

C’est ici que tu ajoutes ton article à la “context window” de l’agent afin qu’il puisse répondre aux questions à son sujet.

Dans le panneau qui s’ouvre à droite, clique sur le bouton « URL ».

Tu peux aussi ajouter des fichiers ou du texte brut.

Colle l’URL, clique sur « Ajouter un élément » et, de retour sur le panneau de configuration, tu verras l’article attaché à la base de connaissances.

💡 À noter : Assure-toi de cliquer sur « Enregistrer » dans l’alerte qui apparaît en bas à chaque fois que tu fais une modification.

Étape 3 : Intègre l’agent sur ton blog


On est prêt à tester notre agent IA vocal.

Pour cela, fais défiler vers le haut, clique sur le bouton « Tester l’agent IA » puis sur « Appeler l’agent IA ».

Dans l’onglet « Widget », tu trouveras un extrait de code que tu peux intégrer sur ton site pour ajouter l’agent.

En dessous, tu as des options pour ajuster son apparence (couleurs, texte, image).

Étape 4 : Fonctionnalités avancées

Choisir la voix

Dans l’onglet « Voice » tu as la possibilité de personnaliser la voix de ton agent.

💡 À noter : Par défaut, les voix en français ont souvent un accent québécois.

En cliquant sur le menu déroulant puis « Find more voices » tu as accès à un large catalogue de voix en français avec différentes caractéristiques (genre, accent, âge, style etc.)

Clique sur « Add » pour pouvoir utiliser une voix avec ton agent.

Collecte des données

Tu as la possibilité de collecter des données des conversations, comme les noms, les numéros de téléphone, les adresses etc.

Utilise des outils

La fonctionnalité la plus puissante des agents IA vocaux sur ElevenLabs. Tu peux équiper ton agent d’outils qui lui permettent de faire des calls API pendant les conversations.

Les cas d’usages sont très nombreux : recherche d’information en temps réel, réservation de rendez-vous, transfert d’appels etc.

💡 À noter : Quelques conseils quand tu utilises des outils :

  • Opte pour un modèle de LLM avancé

  • Adapte ton prompt pour expliquer précisément comment il doit utiliser les outils

  • Soigne les noms et les descriptions des outils car ce sont des informations utilisées par le LLM d’orchestration.

Voici un exemple provenant de la documentation d’ElevenLab avec 2 outils permettant de réserver un rendez-vous.

Le premier est en charge de trouver les créneaux disponibles.

Le deuxième de réserver le créneau

FAQ

  • Combien ça coûte ? —> Le plan gratuit permet d’essayer avec 15 minutes de conversation, puis le premier plan payant à $5 / mois donne droit à 50 minutes de conversation

🗞️ À la une

  • Anthropic dévoile Claude 3.7 Sonnet, première IA dotée d'un "raisonnement hybride" permettant de basculer entre réponses instantanées et réflexion approfondie, avec un mode "pensée étendue" affichant son raisonnement via un bloc-notes.

  • Le modèle établit de nouveaux records en programmation et surpasse ses concurrents comme o1 et DeepSeek R1, tandis que l'introduction de Claude Code, un agent de programmation en ligne de commande, marque une avancée majeure dans l'assistance au développement.

📮 Autres news en bref

  • Grok 3 lance son mode vocal avec deux voix (Ara et Rex) et 10 personnalités différentes, disponible pour les abonnés Premium+ X et SuperGrok.

  • Alibaba annonce QwQ-Max-Preview, une IA focalisée sur le raisonnement qui sera bientôt disponible en open source.

  • Hugging Face présente SmolVLM2, la plus petite famille de modèles capable d'analyser des vidéos sur smartphones.

  • Perplexity tease Comet, son futur navigateur web doté d'intelligence artificielle.

  • Kyutaï, la labo IA de Xavier Niel, lance Hibiki, un modèle de traduction vocale simultanée français-anglais fonctionnant sur iPhone.

  • Un nouvel outil d'IA peut détecter le Covid, le diabète et le VIH à partir d'une simple prise de sang.

💎 Ressources

🎤 À toi le micro

Voilà, c’est la fin de cette 17ème édition de A Kind of Magic, j’espère qu’elle t’a été utile.

N’hésite pas à la partager si c’était le cas.

Dispo pour échanger en réponse à cet e-mail ou sur Linkedin.

À jeudi !

Jean-Charles