Spinoza : une IA générative pensée avec les journalistes pour un journalisme augmenté et éthique
Back to all articles
Alors que les médias font face à des exigences croissantes de productivité, de transformation numérique et de qualité éditoriale, une tension forte persiste : comment intégrer l’intelligence artificielle (IA)dans les rédactions sans renoncer à la déontologie, à la souveraineté des contenus et au rôle des journalistes ?
Le projet Spinoza, lancé en novembre 2023 par Reporters sans frontières (RSF) et l’Alliance de la presse d’information générale, avec l’appui technologique d’Ekimetrics, propose une réponse concrète à cette question.
Pensé dès l’origine avec et pour les rédactions, Spinoza est un prototype d’IA générative conçu pour assister la production d’information sur des sujets complexes, comme le changement climatique, tout en respectant le droit à l’information, la transparence et les valeurs du journalisme.
À retenir
- Spinoza propose une méthode concrète pour intégrer l’IA générative dans les médias sans renoncer à l’éthique journalistique
- Le projet repose sur une coopération étroite entre journalistes, éditeurs et experts IA.
- Ekimetrics a assuré le développement technique du prototype, en structurant l’outil autour de principes de transparence, d’architecture allégée et de souveraineté des données
- Il s’agit du premier projet en France à conjuguer à cette échelle IA générative, exigence éthique, diversité éditoriale et logique de mutualisation
Une démarche inédite : au croisement de la technologie, du journalisme et de l’éthique
Spinoza se distingue par sa méthode de conception. Contrairement aux approches technologiques dominées exclusivement par des plateformes commerciales ou des grands groupes technologiques, ce projet a été développé en co-construction par une organisation de défense de la presse (RSF), une organisation professionnelle représentant les éditeurs de presse d’information générale (l’Alliance), une entreprise spécialisée en data science et en intelligence artificielle (Ekimetrics) et un large panel de journalistes et de rédactions françaises.
L’objectif était clair : tester la possibilité de créer un outil d’IA générative capable d’assister les journalistes sur des sujets denses (dans un premier temps, les enjeux liés au climat), en s’appuyant sur des bases de données fiables : textes de loi, rapports scientifiques, documents institutionnels… et plus de 28 000 articles de presse française publiés depuis 2022.
Grâce à l’expertise technique d’Ekimetrics, le prototype a été développé avec une architecture légère (modèles open source, interface Gradio, utilisation de Qdrant), intégrant un système d’IA générative fonctionnant selon le principe du RAG (Retrieval Augmented Generation) : les contenus générés s’appuient sur un ensemble de documents solides, identifiés par l’agent en fonction de la requête.
Six bases de données au cœur de Spinoza
L’outil tire ses réponses de six ensembles documentaires différenciés, conçus pour couvrir l’essentiel du spectre informationnel autour du changement climatique :
- Données scientifiques (par exemple IPCC, IPBES, travaux académiques…),
- Données législatives,
- Données issues d’organismes publics,
- Données produites par l’ADEME,
- Articles de presse issus de médias partenaires,
- et contenus de l’Agence France-Presse (AFP), notamment sur les pratiques de vérification.
Cette structure garantit la complémentarité des sources, leur traçabilité, leur pertinence… et leur souveraineté, puisque les données sont hébergées sur des serveurs sécurisés sans réutilisation pour l’entraînement des modèles.
Un outil de recherche et de vérification, pas un rédacteur
Spinoza n’est pas un assistant rédactionnel. Il ne rédige pas d’articles, ne propose pas d’angles, et ne mémorise pas l’historique des conversations.
Il fonctionne comme un outil autonome de recherche documentaire, capable de :
- Répondre à des requêtes précises,
- Produire des synthèses sourcées avec liens vers les documents originaux,
- Identifier des extraits pertinents au sein de grandes masses textuelles (rapports, articles, lois).
Chaque corpus est traité par un mini-agent spécialisé (agent presse, agent science…). Puis une synthèse finale est produite par Spinoza, en rendant visibles non seulement la synthèse globale, mais aussi celles réalisées par chaque mini-agent — assurant ainsi la transparence de la documentation et la vérifiabilité des sources.
Une expérimentation soutenue par les rédactions
La première phase du projet a réuni 120 médias partenaires, issus de 12 groupes de presse (Actu.fr, EBRA, L’Équipe, La Nouvelle République, La Provence, Le Télégramme, Libération, l’Union, Nice-Matin, PMSO, Sogemedia et Sud Ouest).
Des journalistes testeurs, accompagnés dans leur utilisation de l’outil, ont confirmé son utilité dès lorsqu’il s'agit de :
- Vérifier une déclaration en la recoupant avec des informations certifiées,
- Recontextualiser une initiative locale avec des données officielles,
- Gagner du temps dans l’analyse de contenus volumineux (rapports GIEC, stratégie bas carbone, etc.).
Un passage à l’open source prévu en 2025
Afin de partager le modèle et d’encourager son appropriation par d’autres rédactions, le projet prévoit la mise en open source du prototype sur la plateforme Hugging Face en 2025.
Cette ouverture répond à trois objectifs :
- Permettre la personnalisation des prompts et des corpus selon les contextes rédactionnels,
- Renforcer les échanges entre professionnels de la donnée, journalistes et éditeurs,
- Faciliter la prise en main d’outils respectueux de l’intégrité de l’information dans les rédactions