Predicting cancer incidence in Switzerland
Projecting the future of cancer incidence in a country is an important task for planning future cancer interventions and research and for allocating economic resources. This is a complex exercise, however, as is any attempt to anticipate the future. Applying leave-future-out cross-validation to data from three Swiss cancer registries (Vaud, Geneva, and Neuchâtel) and the period 1982-2016, we compared the predictive performance of a large number of models used in the cancer prediction literature: widely used age-period-cohort (APC) models and their Bayesian counterparts (BAPC), classical generalized linear models (GLM), autoregressive integrated moving average (ARIMA) models, and linear models (LM). Perhaps surprisingly, we found that the simpler a model is, the better it performs in predicting future cancer incidence, in line with the famous Occam’s razor principle, which recommends looking for explanations constructed with the smallest possible set of elements. Models simply extrapolating past tendencies (ARIMA, LM) outperformed models seeking to estimate and then project underlying effects (GLM, APC, BAPC). Among the first, models relying on few parameters (e.g. low-order ARIMA) outperformed more complex higher-order models that closely fit observed data, as well as methods based on the well-known AIC selection criterion.
The best model in our comparative study, an ARIMA(2,1,1), was applied to predict cancer incidence in Switzerland until 2025, anticipating a substantial stabilization of the risk of developing cancer for the next few years. Combining this trend with the demographic projections of the Swiss Federal Statistical Office, however, we anticipated a substantial increase in the annual number of new cancer cases, entirely due to demographic changes. This increase was estimated at +18% for men and +11% for women, with increases ranging from 4.15% for thyroid in men to 26% for bladder in men.
Estimating (and predicting) trends in cancer incidence over time can be confounded by changes in cancer detection, such as but not limited to: the introduction or modification of screening programs, the use of different screening tools, and incidental detection. In the third part of this thesis, we proposed a model capable of adjusting for these changes and thus estimating the true underlying trend in cancer incidence.
—
La projection de l’avenir de l’incidence du cancer dans un pays est une tâche importante pour planifier les futures interventions et recherches sur le cancer et pour optimiser l’allocation des ressources. Il s’agit toutefois d’un exercice complexe, comme toute tentative d’anticiper l’avenir. En appliquant une validation croisĂ©e aux donnĂ©es de trois registres suisses du cancer (Vaud, Genève et Neuchâtel) pour la pĂ©riode 1982-2016, nous avons comparĂ© la performance prĂ©dictive d’un grand nombre de modèles utilisĂ©s dans la littĂ©rature : les modèles âge-pĂ©riode-cohorte (APC) et leurs Ă©quivalents bayĂ©siens (BAPC), les modèles linĂ©aires gĂ©nĂ©ralisĂ©s (GLM), les modèles autorĂ©gressifs intĂ©grĂ©s Ă moyenne mobile (ARIMA) et les modèles linĂ©aires (LM). De manière peut-ĂŞtre surprenante, nous avons constatĂ© que plus un modèle est simple, plus il est performant dans la prĂ©diction, conformĂ©ment au cĂ©lèbre principe du rasoir d’Occam, qui veut que la solution la plus simple soit prĂ©fĂ©rĂ©e. Les modèles qui se contentent d’extrapoler les tendances passĂ©es (ARIMA, LM) sont plus performants que ceux qui tentent d’estimer puis de projeter des effets sous-jacents (GLM, APC, BAPC). Le modèle le plus performant a Ă©tĂ© L’ARIMA (2,1,1). Ce dernier s’est notamment rĂ©vĂ©lĂ© meilleur que ceux qui sĂ©lectionnent la complexitĂ© du modèle avec un critère comme l’AIC.
Ce meilleur modèle a Ă©tĂ© appliquĂ© pour prĂ©dire l’incidence du cancer en Suisse jusqu’en 2025, anticipant une stabilisation du risque de dĂ©velopper un cancer dans les annĂ©es Ă venir. En combinant cette tendance avec les projections dĂ©mographiques de l’Office fĂ©dĂ©ral de la statistique, nous avons cependant anticipĂ© une augmentation substantielle du nombre annuel de nouveaux cas de cancer, entièrement due aux changements dĂ©mographiques. Cette augmentation a Ă©tĂ© estimĂ©e Ă +18% pour les hommes et +11% pour les femmes, avec des augmentations allant de 4,15% pour la thyroĂŻde chez l’homme Ă 26% pour la vessie chez l’homme.
L’estimation (et la prĂ©vision) des tendances de l’incidence du cancer au fil du temps peut ĂŞtre en partie faussĂ©e par les changements dans les processus de dĂ©tection du cancer, tels que, mais sans s’y limiter : l’introduction ou la modification des programmes de dĂ©pistage, l’utilisation de diffĂ©rents outils de dĂ©pistage, et la dĂ©tection opportuniste. Dans la troisième partie de cette thèse, nous avons proposĂ© un modèle capable de s’ajuster Ă ces changements et donc d’estimer la vĂ©ritable tendance sous-jacente de l’incidence du cancer.