Chaos dans l’utilisation des données

Pas besoin de relancer le débat sur les coûts de la santé et leurs causes bien identifiées, que personne n’ose véritablement aborder. Dans ce contexte, la numérisation des
données et l’intelligence artificielle sont perçues comme des solutions miraculeuses, soutenues par tous les acteurs du système de santé. Cette approche n’a rien de novateur, car elle est adoptée depuis longtemps dans de nombreux pays comme les Etats-Unis, le Royaume-Uni et les pays scandinaves, pour ne citer que quelques exemples.
Navigation à vue dans la collecte des données
Dans notre système de santé, les données ne sont pas gérées uniformément, ce qui entraîne des surcoûts, ainsi que des soins excédentaires et inappropriés.

Le taux de numérisation des dossiers de santé en Suisse est, contrairement à ce qui est souvent dit, remarquablement élevé, atteignant environ 80% et augmentant régulièrement depuis dix ans. Cela contredit souvent l’affirmation selon laquelle la Suisse «est en retard». Le problème n’est donc pas la «numérisation» dans le système de santé suisse, mais son caractère sauvage, ou «non contrôlé».
La numérisation du système de santé produit inéluctablement d’importantes quantités de données, néanmoins très difficilement utilisables dans notre système, quelle que soit l’intention. Notre capacité à utiliser ces données, même pour les tâches les plus simples, est souvent entravée. Chaque approfondissement (étude, registre, enquête, etc.) nécessite le développement de flux spécifiques, de systèmes, de bases de données, des procédures de fusion de données. Cela implique souvent également des saisies et traitements manuels, sources de coûts et d’erreurs, sans compter les autorisations et les commissions d’éthique.
Les données ont un prix
La numérisation a également largement contribué à augmenter la charge administrative pour les professionnels de santé, et ce à divers degrés selon les professions. La profession médicale est celle dont la part de charge administrative a significativement augmenté, selon plusieurs études. Wenger et al. observent que les internes en médecine au CHUV travaillent en moyenne 11,6 heures par jour, dont 1,7 heure avec les patientes et patients et 5,2 heures sur un ordinateur. Pendant le reste du temps, ils sont occupés avec les autres professionnels, avec les équipes, au téléphone, etc. Sur une journée,
52% du temps de travail quotidien n’est pas lié directement à la prise en charge des patientes et patients.1 On peut donc dire que si les données ont de la valeur, elles ont également un coût très élevé, tant sur le plan économique qu’en ce qui concerne l’actuelle crise à la fois identitaire et motivationnelle des professionnels de santé.
«Les médecins-assistant/es du CHUV travaillent 5,2 heures par jour devant un ordinateur.»
Les données de santé jouent un rôle crucial pour comprendre la santé et les maladies, imaginer de nouvelles thérapies, innover en prévention et identifier des risques systémiques liés aux facteurs d’exposition. Elles permettent également de mesurer, évaluer et améliorer la qualité des traitements et des processus de prise en charge, comparer les processus de soins, réduire la surmédicalisation et les soins inappropriés, et en définitive, piloter le système de santé par la qualité. Elles sont essentielles dans le partenariat avec la patiente ou le patient, un point central de l’approche européenne sur les données de santé, mais absent du programme du Conseil fédéral DigiSanté, qui malheureusement néglige le rôle central des patientes et patients, tout comme il néglige la formation.
Les critères d’efficacité, d’adéquation et d’économicité (EAE) sont un élément central de la LAMal, au sens de l’article 32, et font partie des conditions de prise en charge des prestations par l’assurance obligatoire des soins (AOS). Les mesures d’opérationnalisation de ces critères publiées par l’OFSP laissent toutefois les principales questions sans réponse.
«52% du temps de travail quotidien n’est pas lié directement à la prise en charge des patientes et patients.»
Un dataset pour chaque situation
Cela illustre une situation emblématique sur les données de santé: lesquelles sont nécessaires? Cette question, centrale, est à l’origine de la dérive actuelle dans la gouvernance des données. Chaque acteur voit le problème sous un angle différent. Quelles données sont nécessaires pour gérer une pandémie? Et s’il s’agit plutôt d’un tremblement de terre? Ou d’un accident chimique? Ce qui est vrai à l’échelle d’une population l’est pour chaque individu. Quelles sont les meilleures données pour évaluer une douleur abdominale chez une jeune femme ou chez une personne de 60 ans avec des risques cardiovasculaires? Après traitement d’un cancer du côlon? Il existe un dataset pertinent pour chaque situation. Et ce dataset est notamment en lien avec la nature bayésienne, probabiliste, des phénomènes cliniques et de la capacité à évaluer un risque, avec un certain degré de fiabilité, dans un contexte probabiliste et en tenant compte du coût de l’évaluation et de la capacité des résultats à fournir des réponses (p. ex. thérapeutiques) avec une valeur ajoutée suffisante.

Le partage des données pose problème
La question des données nécessaires touche de nombreux autres domaines, comme les questions autour de l’évolution des coûts de la santé ou l’évaluation de l’efficience des prises en charge.
Chaque question requiert des données spécifiques et doit être envisagée individuellement. Plutôt que de poursuivre cette discussion sans réponse, il est préférable d’examiner la situation sous l’angle de la capacité générale à réutiliser les données. Et dès lors, il faut considérer les verrous réglementaires et techniques. Un enseignement important de l’activation de la loi sur les pandémies, qui a permis de lever les verrous réglementaires, est que cela n’a pas amélioré la situation concernant l’utilisation des données: en résumé, le chaos. Le problème principal n’est pas d’accéder aux données, mais de pouvoir les exploiter lorsqu’on les a obtenues.
Il est donc essentiel de mettre en place un environnement permettant de partager n’importe quelles données de santé nécessaires à un moment donné pour un objectif autorisé. Cela permet de discuter de points plus précis:
Quel est le périmètre des données de santé?
Comment réunir des conditions permettant leur accès sans entraves techniques?
Quelles sont les contraintes permettant d’activer ce système et d’obtenir les données?
Comment clarifier le cadre réglementaire permettant d’atteindre ces objectifs?
Quelles sont les actions requises pour l’opérationnaliser?
Cela permet de poser un objectif stratégique important. Il ne s’agit pas de partager les données de santé, mais de mettre en place le cadre technique et sémantique afin que ces données puissent être partageables. Ce changement de paradigme permet d’éviter les questions débattues depuis la mise en place de la LAMal en Suisse, à savoir QUI peut accéder à QUOI et POURQUOI, et d’envisager une stratégie et une implémentation des conditions-
cadres permettant le partage des données de manière simple et transparente, pour chaque situation justifiée. Un prérequis central de ce paradigme concerne l’adoption de standards techniques et sémantiques d’interopérabilité, imposés à tous les fournisseurs de solutions numériques pour la santé en Suisse. Les stratégies commerciales tendent en effet à s’opposer à l’usage de tels standards.
L’hyperstructuration n’est plus nécessaire
Une fois ces standards adoptés, il ne sera plus nécessaire de procéder à une hyperstructuration des données. L’évolution rapide des grands modèles de langage (large language models, LLM) remet en effet en question la tendance à hyperstructurer les données médicales. Cette hyperstructuration est coûteuse en temps d’acquisition et en contenu informationnel. Avec les technologies actuelles en IA, cette tendance devient obsolète et délétère.
Pour résumer, il faut assainir le marché de systèmes informatiques: le marché national devrait être limité aux seuls systèmes qui appliquent les standards d’interopérabilité techniques et sémantiques. De plus, il faut clarifier les besoins informationnels pour les divers usages et simplifier les flux informationnels. Enfin, il faut appliquer des visions innovantes de la gestion des données et explorer, évaluer, les possibilités de l’intelligence artificielle. Si nous parvenons à atteindre ces objectifs, nous aurons un système de partage de données médicales efficace, avec un effet positif sur la qualité des prestations médicales et en évitant ainsi les soins excessifs et inadéquats.
1 Ann Intern Med. 2017; 166:579-586. doi:10.7326/M16-2238