- La réanalyse des études sur les passerelles montre que leurs modèles ne prédisent pas mieux le tabagisme que le hasard lorsqu’ils sont testés correctement.
- La plupart des articles n’ont jamais indiqué le degré de précision de leurs modèles, et de nombreux auteurs ont refusé de partager leurs résultats.
- L’utilisation de meilleures méthodes n’a rendu les modèles que légèrement plus précis, et le vapotage s’est avéré être l’un des facteurs prédictifs les plus faibles du tabagisme.
- Les résultats correspondent aux données réelles : le tabagisme chez les adolescents continue de baisser, ce qui suggère un « effet de détournement » plutôt qu’une porte d’entrée.
Une nouvelle analyse a jeté un sérieux doute sur la théorie dite de la porte d’entrée, selon laquelle le vapotage incite les adolescents à fumer.
L’étude, dirigée par Floe Floxon, scientifique et analyste de données, et le Dr Ray Niaura, psychologue, a révélé que les modèles statistiques sur lesquels reposent les allégations de passerelle ne sont pas fiables et ne permettent pas de prédire quels sont les jeunes qui commenceront à fumer.
Ces résultats ont été présentés au début du mois lors de la 2025e réunion annuelle de la Society for Research on Nicotine and Tobacco (SRNT-E) à Cluj-Napoca, en Roumanie.
« Le point essentiel ici est que si un modèle ne peut pas prédire avec précision quels adolescents vont fumer et lesquels ne le feront pas, toute déduction faite à partir de ce modèle ne sera pas fiable », a déclaré M. Floxon.
Les modèles qui ne fonctionnent pas
Les articles de Gateway s’appuient généralement sur des rapports de cotes tirés de grandes enquêtes, affirmant que les adolescents qui essaient les vapes sont plus susceptibles de fumer plus tard. Mais, explique Floxon, les rapports de cotes ne suffisent pas à prouver une cause, surtout lorsque le tabagisme est déjà rare.
Selon l’enquête nationale sur le tabac chez les jeunes réalisée en 2024 par le CDC, seuls 1,4 % des adolescents fumaient des cigarettes.
Cette rareté pose un problème. Les modèles peuvent sembler « précis » simplement en prédisant que presque personne ne fume. « Peu importe l’importance du rapport de cotes ou de la valeur p si le modèle se trompe dans ses prédictions », a déclaré M. Floxon.
Pour y remédier, les chercheurs utilisent une précision équilibrée, qui mesure la capacité d’un modèle à prédire à la fois les fumeurs et les non-fumeurs. Une précision équilibrée de 50 % signifie que le modèle n’est pas meilleur qu’une pièce de monnaie.
Lorsque Floxon et Niaura ont réanalysé les études publiées sur les passerelles, c’est exactement ce qu’ils ont constaté. « Pour les études que nous avons pu analyser, nous avons constaté que les précisions équilibrées sont extrêmement faibles, proches de 0,5, ce qui n’est pas mieux qu’une prédiction fortuite.
Informations manquantes
L’équipe a également découvert que la plupart des articles existants n’ont jamais fait état de la précision de leur modèle. « Nous n’avons pas pu trouver un seul article qui fasse état de la précision de son modèle », a déclaré M. Floxon. Lorsqu’ils ont contacté directement les auteurs des études, « la plupart d’entre eux n’ont pas partagé cette information ».
Celles qui ont partagé leurs données ont obtenu des résultats médiocres. Et comme de nombreuses études ont utilisé les mêmes ensembles de données, les auteurs estiment qu’il est raisonnable de supposer que les modèles non partagés donnent des résultats tout aussi médiocres.
Essayer d’améliorer les modèles
L’équipe a ensuite vérifié si elle pouvait faire mieux avec des méthodes modernes. Elle a corrigé le déséquilibre des données en utilisant des poids de classe équilibrés, testé les performances en utilisant la validation croisée et essayé des modèles d’apprentissage automatique tels que les machines à vecteurs de support et les réseaux neuronaux.
Ces mesures ont permis d’augmenter la précision de l’équilibre de 10 à 20 points de pourcentage – une amélioration, mais qui reste modeste. Plus important encore, les modèles améliorés ont montré que le vapotage n’était pas un facteur important pour prédire le tabagisme.
« L’utilisation de l’ecigarette au départ n’a eu qu’un effet négligeable sur la capacité du modèle à prédire le tabagisme au moment du suivi », a expliqué M. Floxon. En revanche, les facteurs de risque classiques (désir de fumer, amis fumeurs et consommation d’autres substances) se sont révélés beaucoup plus efficaces.
Aucun signe de passerelle
Dans l’ensemble, ces résultats remettent en cause l’idée d’une passerelle entre le vapotage et le tabagisme. « Nous ne voyons aucune preuve de l’existence d’une passerelle nette dans les tendances au niveau de la population, qui représentent la réalité », a déclaré M. Floxon. Le tabagisme chez les adolescents a continué à diminuer, même si le vapotage est devenu plus courant.
Cela suggère plutôt un « effet de détournement ». Cela signifie que certains jeunes qui auraient pu essayer la cigarette essaient les vapes à la place, mais que le nombre total de fumeurs continue de diminuer.
Un appel à la rigueur
Floxon a souligné que cela ne signifie pas que le vapotage chez les adolescents est inoffensif. « Il ne s’agit pas de dire que l’utilisation de l’ecigarette par les adolescents est acceptable. Mais à tout le moins, il n’y a pas d’effet apparent de passerelle ».
Le plus gros problème, selon lui, est que la théorie de la passerelle a été élaborée à partir de modèles qui ne satisfont pas aux vérifications de base. « Les rapports de cotes sont erronés parce que les modèles sont erronés », a-t-il déclaré. « Un modèle qui ne peut pas prédire avec précision l’initiation au tabagisme ne peut pas nous dire avec précision ce qui est associé à l’initiation au tabagisme.
Le message de l’équipe aux chercheurs et aux décideurs politiques est que les modèles doivent être testés correctement et se concentrer sur les prédicteurs qui comptent réellement. Floxon a déclaré : « Vous ne pouvez pas vous contenter de jeter des données dans un modèle de régression logistique en espérant que tout ira pour le mieux. Vous devez évaluer rigoureusement les performances du modèle avant même de commencer à vous préoccuper de la taille et de la signification statistique d’une association ».
