Dans la première partie de ce billet, j’ai décrit quelques-unes des façons dont les outils de données massives peuvent être utilisés dans le secteur de la santé et j’ai souligné l’ironie de la situation avec laquelle nous devons composer : la qualité et l’efficacité de certaines méthodes d’utilisation des données sont couvertes à la section « traitement, paiement et opérations » de la loi HIPAA (« Health Insurance Portability and Accountability Act ») aux États-Unis. Cependant, l’utilisation aux fins de recherche des données personnalisées des patients est traitée selon des contraintes beaucoup plus sévères, en vertu du fait qu’elles sont « conçues pour développer ou contribuer à des connaissances généralisables. »

Certaines analyses de données et recherches observationnelles peuvent également être effectuées à partir des données dépersonnalisées de l’HIPAA. Cependant, les défis traditionnels associés aux données dépersonnalisées constitueront des obstacles plus sérieux en ce qui a trait à d’autres résultats issus des données massives. Les outils de données massives et les ensembles de données, par exemple, vont remettre les risques de réidentification des données dépersonnalisées de L’HIPAA à l’avant-plan. Lorsque des ensembles plus importants et plus variés de données publiquement disponibles sont combinés aux données récemment dépersonnalisées, les approches existantes de dépersonnalisation existantes perdent en durabilité et les identités deviennent faciles à rétablir.

Les données dépersonnalisées constituent également un défi dans le cadre des analyses approfondies nécessaires pour différencier la causalité de la corrélation lors de l’observation des données. C’est en effet l’identité du patient qui constitue le lien entre les données pour les recherches axées sur le patient et qui permet l’agrégation et le recoupement continus des données au fil du temps. Évidemment, la dépersonnalisation complète des données rend impossible la communication avec le patient lorsque de nouvelles conclusions sont tirées ou de nouvelles thérapies sont offertes.

Analyser les données cliniques et liées aux demandes de remboursement en vue d’assurer la qualité et l’efficacité dans le cadre de soins responsables est certainement un important incitatif vers l’utilisation des données massives dans le secteur des soins de santé à l’heure actuelle. Dans ce domaine comme dans d’autres, la flexibilité des données analysées par les outils de données massives (structurées ou non) contribue à la poursuite de cet objectif complexe.

Il est donc important de s’attarder à l’amélioration du partage et de la gestion des données moins bien structurées. Pour assurer la continuité de l’infrastructure des soins, il importe que les données d’un dossier médical électronique (DME) puissent être exploitées et traitées par un autre DME grâce à des messages de données fortement structurées. Les approches en matière de données massives tirent parti de ces données hautement structurées, mais ne s’y limitent pas. Les normes et technologies permettant l’indexation, la correction, le recoupement et la mise en corrélation des données sont importantes. Pour l’instant, les intervenants doivent s’en tenir à l’utilisation de techniques ad hoc d’accumulation d’entrepôts de données, à moins que ne soient proposées d’autres approches de normalisation de l’infrastructure.

Une tension similaire se remarque également dans le domaine de la qualité des soins de santé où les approches visant à améliorer les mesures de la qualité des résultats à l’échelle nationale ne tirent pas parti des quantités massives de données électroniques moins bien structurées qui sont déjà disponibles dans l’infrastructure des soins de santé.

Malheureusement, comme c’est le cas pour d’autres types d’utilisation, disposer de données cliniques approfondies liées au patient peut être utile dans le cadre d’enquêtes sur les épidémies, de signalement sur l’exposition de matières dangereuses, et de freinage de la propagation de maladies infectieuses. Certaines de ces données ne quittent pas l’environnement des soins cliniques. Les efforts actuels en vue d’élargir la portée des données utilisées aux fins d’enquêtes et autres objectifs de santé publique se concentrent principalement sur l’accès à distance aux DME ou aux données distribuées hautement structurées. Cependant, la pleine utilisation des outils locaux de données massives permettrait d’adopter une nouvelle approche en vue de répondre aux demandes locales pour des données qui peuvent être moins bien structurées et d’usage plus général.

Le large éventail de défis liés aux politiques et à l’utilisation des données massives est encourageant dans la mesure où il suggère de nombreuses utilisations en matière de santé. Au fur et à mesure de l’évolution du travail en matière de données massives, la prise en considération des obstacles connus à l’utilisation aux fins d’analyse devrait devenir un point de mire de plus en plus important. Des politiques différentes devraient être considérées pour permettre aux résultats en matière de données massives de répondre pleinement à la fulgurante tendance des données massives.

À propos de l’auteur

Picture of Dr. John Loonsk

Dr. John Loonsk

Chef de la direction informatique, secteur de la santé

Le Dr Loonsk a occupé divers postes de gestion des technologies de l’information au sein d’organisations gouvernementales, de cliniques et d’entreprises privées du secteur de la santé. Avant de se joindre à l’équipe de CGI, il a agi à titre de directeur de ...

Ajouter un commentaire

Comment editor

  • No HTML tags allowed.
  • Lines and paragraphs break automatically.
Règle de modération du blog et conditions d'utilisation