Avertissement :
Ce travail est une réalisation personnelle de Cyrille37,
basée
sur les données publiques de l’observatoire de l’association
Anticor, utilisées avec leur autorisation.
Les traitements, interprétations, analyses et visualisations présentées n’engagent que leur auteur
«Cyrille37» et ne sauraient en
aucune manière impliquer la responsabilité de l’association
Anticor,
ni refléter ses positions officielles.
Le corpus de texte à été extrait de l’observatoire début janvier 2026.
Quelques visualisations
- wordscloud : extraction de noms avec du code traditionnel (expressions régulières) et quelques règles de normalisation comme "PSG -> Paris-Saint-Germain".
- graphLmExtract : un graph des entités (personnes,
organisations,
lieux, mot-clés) avec leurs connexions.
Les entités ont été extraites avec une IA (LLM/SLM Language Model).
⏳ Attention, données volumineuses (~65Mo) à télécharger puis à calculer.
Travaux connexes
- graphTags (Pas terminé, buggué): un graph des connexions entre étiquettes (tags) des articles de l’observatoire.
- lmExtractBench : un comparatif d’extration de texte avec différents petits modèles de langage (SLM) opensource exploités avec llama.cpp se partageant une Geforce-RTX-3060 et un i7-1360P-13th.