​Le Cerveau : Le Raisonnement et la Planification

Le deuxième pilier, les Mains, est ce qui permet à l’intelligence artificielle de sortir de l’abstraction pour impacter le monde réel. Sans ce pilier, l’IA reste un simple conseiller ; avec lui, elle devient un exécutant.
​L’utilisation d’outils (souvent appelée Tool Use ou Function Calling) permet à l’agent d’accéder à des capacités qu’il ne possède pas nativement dans son modèle de langage.
​1. L’Extension des Capacités Natives
​Un modèle de langage (LLM) a des limites intrinsèques : il n’est pas bon en calcul complexe et ses connaissances s’arrêtent à sa date de fin d’entraînement. Les « Mains » règlent ce problème :

​Calculatrices et Moteurs de calcul : Pour garantir une précision mathématique absolue (ex: via WolframAlpha).
​Recherche Web en temps réel : Pour obtenir les dernières actualités, cours de bourse ou documentations techniques à jour.
​Exécution de Code : L’agent peut écrire et exécuter son propre code (Python, JavaScript) pour manipuler des données ou créer des fichiers.

​2. L’Interaction avec les APIs (Le Pont Logiciel)
​Le véritable pouvoir de la révolution agentique réside dans la capacité de l’IA à utiliser les logiciels que nous utilisons déjà. L’agent ne « regarde » pas l’écran comme un humain ; il communique directement avec les APIs (Interfaces de Programmation).

​Outils de productivité : Lire et envoyer des emails, programmer des réunions dans un calendrier ou modifier des documents.
​Logiciels métiers : Mettre à jour un CRM (Salesforce), extraire des données d’un ERP ou envoyer des notifications sur Slack.
​Services Cloud : Déployer un serveur, gérer des bases de données ou interroger des fichiers PDF complexes.

​3. Le Processus de Sélection de l’Outil
​L’intelligence de ce pilier ne réside pas seulement dans l’action, mais dans le choix. Le processus se déroule généralement ainsi :

​Identification du besoin : L’agent comprend qu’il ne connaît pas la réponse ou qu’il doit effectuer une action physique.
​Sélection : Il choisit l’outil le plus approprié parmi une panoplie disponible (ex: choisir « Navigateur Web » pour une info récente, mais « Python » pour un graphique).
​Formatage : Il traduit sa pensée en une commande technique que l’outil peut comprendre (JSON, syntaxe de fonction).
​Interprétation : Il reçoit le résultat de l’outil et l’intègre dans sa réflexion pour passer à l’étape suivante.

​4. L’Agent comme « Connecteur »
​Dans ce schéma, l’agent devient une interface universelle. Au lieu que l’humain doive apprendre à utiliser dix logiciels différents pour accomplir une mission, il donne l’ordre à l’agent, qui utilise ses « mains » numériques pour manipuler chaque logiciel à sa place.
​C’est ce passage de « l’IA qui écrit du texte sur le travail » à « l’IA qui fait le travail ».