Aller au contenu principal

Observatoire WebConforme

Méthodologie du baromètre conformité France

Comment nous auditons automatiquement un corpus de sites français publics pour alimenter notre observatoire de l'accessibilité numérique.

Dernière mise à jour :

1. Corpus audité

Le baromètre couvre 610 domaines français publics, répartis en 10 catégories pour refléter la diversité du web FR :

  • CAC 40 (40 sites) — grands groupes cotés Euronext Paris
  • E-commerce (100) — top marchands FR (FEVAD, classements marchés)
  • Services gouvernementaux (100) — ministères, agences, portails publics
  • Startups (100) — French Tech, Bpifrance, licornes
  • Collectivités territoriales (60) — régions, métropoles, villes > 100 000 habitants
  • Médias (50) — presse en ligne, quotidiens, magazines
  • PME (50) — ETI secteur services
  • Retail (50) — grande distribution physique et e-commerce
  • Banques (30) — banques universelles + néo-banques FR
  • Associations (30) — associations reconnues d'utilité publique

Chaque domaine est vérifié, dédoublonné et classé avant intégration. Les seeds sont versionnés dans notre code source (11 fichiers CSV publics). Extensions du corpus à 3 000+ sites programmées en sprint dédié.

2. Fréquence des scans

Le corpus complet est ré-audité une fois par mois, typiquement entre le 1er et le 5 du mois. Cette cadence permet d'observer les évolutions liées aux déploiements, refontes et corrections, sans saturer les serveurs audités. Elle alimente aussi les variations temporelles publiées dans l'étude annuelle État de l'accessibilité en France 2026.

3. Protocole technique

  • User-Agent identifié : WebConforme-Barometre/1.0 (+ URL publique vers la politique de crawl)
  • Respect strict de robots.txt via le parseur standard urllib.robotparser. Tout site qui interdit notre UA est exclu sans contestation.
  • Rate-limit 1 requête / seconde / domaine pour éviter toute charge induite.
  • Découverte des pages via sitemap.xml ; max 10 pages par site pour équilibrer représentativité et coût de crawl.
  • Moteur d'audit : navigateur Chromium headless (Playwright) + injection de axe-core (règles WCAG 2.1 AA automatisables).
  • Viewport de test : 1920×1080 (desktop), timeout 30 s par page.

4. Critères mesurés

Chaque page produit une liste de violations axe-core classées par impact (critical, serious, moderate, minor). Les règles axe-core sont cartographiées vers le RGAA v4.1 (référentiel officiel DINUM) via notre table de correspondance maintenue à jour. Le score global de chaque site est la moyenne des scores de ses pages auditées (ratio tests passés / tests totaux).

Trois statuts sont attribués :

  • Conforme partiel AA — score ≥ 95 % et zéro violation critique
  • Amélioration nécessaire — score entre 50 % et 95 %
  • Non conforme — score < 50 % OU présence d'au moins une violation critique

5. Exclusions transparentes

Sont exclus du comptage des « sites audités » sur la page d'accueil et dans nos agrégats :

  • Sites bloqués par robots.txt (statut blocked_by_robots)
  • Sites en erreur réseau persistante (DNS, TLS, 5xx) après retry
  • Pages nécessitant authentification (scan limité aux pages publiques)
  • Contenu en iframe tiers (widgets externes) — non scanné

Seuls les sites ayant au moins une page auditée avec succès entrent dans le compteur public. Cette rigueur d'exclusion est essentielle à l'intégrité des chiffres affichés.

6. Demande de correction ou de déréférencement

Tout responsable de site peut demander une ré-évaluation anticipée, une correction post-audit ou un déréférencement du baromètre public en écrivant à barometre@webconforme.fr. Les demandes sont traitées sous 14 jours ouvrés avec preuve d'identité professionnelle.

7. Mention juridique

Observatoire à visée informative. Ne constitue pas un audit officiel RGAA au sens du décret 2019-768. Les données de scan automatisé ne se substituent pas à un audit humain expert. Les scores affichés relèvent d'une évaluation automatisée partielle (30-40 % des critères RGAA sont testables machine) et ne permettent pas de certifier la conformité complète d'un site.

8. Liens croisés