Analyse d'article
Équilibre et gonarthrose : la méta-analyse qui ne tient pas debout
L'entraînement de l'équilibre pour l'arthrose du genou : une méta-analyse prometteuse sur le papier, mais une hétérogénéité à 92% et des IC qui traversent le zéro. Décryptage d'une étude qui vacille.
Par Team Klair Kiné · 10 min de lecture · Publié le 19/06/2026
Équilibre et gonarthrose : quand la méta-analyse vacille
L'entraînement de l'équilibre fait partie de l'arsenal classique du kiné dans la prise en charge de la gonarthrose. Proprioception, stabilité posturale, prévention des chutes — on y croit, on le prescrit, et les patients y adhèrent. Mais quand on cherche des preuves solides pour justifier cette pratique, que trouve-t-on réellement dans la littérature ?
Prabhakar et al. (2023) ont tenté de trancher avec une revue systématique et méta-analyse d'ECR. Le problème : une hétérogénéité statistique explosive (I² > 80%), des intervalles de confiance qui flirtent avec le zéro, et une discussion qui minimise ses propres faiblesses. On vous décrypte cette étude et surtout ce que ça change concrètement dans votre pratique.
Effectiveness of balance training on pain and functional outcomes in knee osteoarthritis: A systematic review and meta-analysis
Question clinique (PICO)
Analyse méthodologique
Résultats clés
Différence moyenne de -0.79 en faveur de l'équilibre (IC 95% : -1.59 à 0.01, p < 0.05). Mais attention : l'IC inclut la valeur nulle et l'I² est de 92%. Un résultat statistiquement fragile et cliniquement inexploitable.
Détail des résultats par critère de jugement :
- VAS (douleur) : DM = -0.79 (IC 95% : -1.59 à 0.01, p < 0.05, I² = 92%) → significativité marginale, IC traversant le zéro
- TUG (mobilité fonctionnelle) : DM = -1.71 sec (IC 95% : -3.09 à -0.33, p < 0.0001, I² = 95%) → significatif mais hétérogénéité extrême
- WOMAC (fonction globale) : DM = -0.02 (IC 95% : -0.44 à 0.40, p < 0.0001, I² = 81%) → aucun effet
Avec des I² de 92%, 81% et 95%, les études incluses sont trop différentes pour être combinées de manière significative. Le modèle à effets aléatoires ne résout pas le problème fondamental : ces études ne mesurent pas la même chose de la même façon.
La p-value est < 0.05 mais l'IC va de -1.59 à 0.01 — il inclut la valeur nulle. Soit il y a une erreur d'arrondi, soit la significativité est si marginale qu'elle ne veut rien dire cliniquement. Les auteurs ne discutent pas cette contradiction.
Re-discussion de la discussion
Les auteurs reconnaissent l'hétérogénéité (« Although due to the heterogeneity of the included articles the treatment impact may be overestimated ») mais ne vont pas au bout de leur logique. Si l'impact est potentiellement surestimé avec des I² > 80%, pourquoi maintenir une méta-analyse globale plutôt qu'une synthèse narrative ou des sous-groupes ?
Plus problématique encore : les auteurs affirment que « the key outcome measures... were homogeneous » et que les IC étroits témoignent de la « validity and sensitivity » de l'analyse. C'est objectivement faux : un I² de 92% n'est pas « homogène », et un IC de -1.59 à 0.01 pour le VAS n'est pas « étroit ». Cette minimisation des limites dans la discussion est la faiblesse la plus préoccupante de cette revue.
Enfin, l'absence de toute tentative d'analyse de sous-groupes ou de méta-régression pour explorer les sources d'hétérogénéité est une lacune majeure. C'est une attente standard pour toute méta-analyse présentant de tels niveaux d'I², et les auteurs n'expliquent pas cette omission.
Impact clinique
Recommandations pour la recherche future
- Standardiser les protocoles d'entraînement à l'équilibre (type, durée, fréquence, progression) entre les études
- Inclure les études non anglophones et la littérature grise pour réduire le biais de langue et de publication
- Définir la MCID pour chaque critère de jugement avant de lancer les essais
- Explorer les sources d'hétérogénéité par des analyses de sous-groupes (sévérité, âge, type d'exercice) et des méta-régressions
- Intégrer des critères centrés sur le patient : qualité de vie, satisfaction, événements indésirables
- Évaluer l'entraînement à l'équilibre au sein de programmes multimodaux vs. en monothérapie
- En cas d'hétérogénéité élevée persistante, privilégier une synthèse narrative rigoureuse plutôt qu'une méta-analyse globale