L’IA générative permet d’analyser rapidement des rapports financiers en puisant à la fois dans des données internes et des sources externes. De quoi permettre des analyses autrement impossibles sur de grands volumes d’information. De quoi aussi accélérer et fiabiliser la production des documents d’information financière, qui chaque année requiert des analyses approfondies dans des calendriers serrés. On vous dit comment.
AI Impact Scan : notre diagnostic flash
Afin de produire l’analyse de l’évolution du chiffre d’affaires et du bénéfice net d’un grand assureur français aux multiples filiales et implantations internationales, nous avons chargé dans la plateforme IA développée par SeaBird la vingtaine de rapports annuels disponibles pour la période 1997 à 2023. Cela représente un total de 10 000 pages de documents.
Ce que l’IA permet d’obtenir
- un tableau présentant le chiffre d’affaires par an, avec un format cohérent (en millions d’euros) et une réplique avec le bénéfice net afin de comparer l’évolution.
- un graphique pour visualiser cette évolution du chiffre d’affaires. Idem avec le bénéfice net.
- des explications sur les variations du chiffre d’affaires d’une année sur l’autre
- à partir des documents chargés,
- enrichis par des éléments de contexte issus d’une recherche internet et de liens d’articles
- une présentation de ces résultats dans Powerpoint.
Technologie utilisée : l’Agentic RAG
L’Agentic RAG a l’avantage, contrairement au RAG classique*, de mettre en œuvre une ‘réflexion itérative’. L’agent va réfléchir pour savoir s’il doit faire une ou plusieurs recherches dans sa base de connaissance et va ensuite reformuler la réponse en agrégeant les résultats.
Il peut de plus accéder à d’autres ‘outils’ comme par exemple des moyens d’accéder à des bases de données structurées omniprésentes en finance, un accès internet pour enrichir les insights, de la génération de code pour créer des graphiques, accéder à des API ou services pour générer les documents ou présentations… tout ceci de manière autonome et en fonction de la problématique.
Approche
3 composants sont nécessaires techniquement :
- une base de données vectorielle (sur laquelle sont stockés des embeddings/plongements de nos documents). Il s’agit de transformer un document texte en vecteurs de chiffres, pour que la machine puisse les traiter.
- un orchestrateur de LLM, qui permet de solliciter le LLM de façon programmatique (passer outre le simple prompting en mode requête en langage naturel).
- une partie de prompt engineering pour ‘guider’ la machine, l’orchestrateur et le LLM.
Challenge
S’assurer que l’IA ne prélève pas seulement quelques informations à ajouter au contexte mais analyse bien tous les fichiers. L’enjeu était d’inclure les chiffres mais aussi des éléments narratifs d’explication propres à l’entreprise – issus des rapports annuels-, et des éléments de contexte macroéconomique ou financier, recueillis via des sources externes.
Gain
La solution testée offre un gain de temps considérable, à la fois aux directions financières, à des fins d’analyse et de pilotage, et aux équipes de communication dans le cadre de la communication financière, qu’il s’agisse de déterminer les messages clés ou de réaliser les supports de présentation.
Ce temps dégagé est d’autant plus important que la base d’information considérée est volumineuse.
Elle offre également une facilité d’utilisation dans un environnement sécurisé pour vos données. Cela fonctionne comme un chatbot, sécurisé et nourri par l’ensemble des données internes, qui répond à une simple question posée en langage naturel.
Ce cas d’usage peut s’appliquer à bien d’autres besoins d’analyse de documents, combinant données chiffrées et langage naturel, pour produire du narratif, des tableaux et graphiques ou encore des présentations Powerpoint.
Pour vous aider à mieux comprendre ce que l’IA générative peut – ou ne peut pas – faire pour vous, SeaBird teste et implémente les technologies et leurs applications dans les directions financières des acteurs de la banque, de l’assurance et de la gestion d’actifs.
*Le RAG classique fait une recherche ‘one shot’ dans la base de connaissance et restitue le résultat qui semble le plus approprié. Dans une question typique de notre use case, il faut rechercher les rapports annuels de N années, donc besoin de faire N recherches.