L’intelligence artificielle ouvre de nouvelles perspectives pour la biologie médicale, de l’aide à l’interprétation des résultats à la détection d’anomalies. Toutefois, la performance d’un modèle dépend avant tout de la qualité des données utilisées pour son entraînement. Des données incomplètes ou peu représentatives peuvent introduire des biais et compromettre la fiabilité des analyses.
Des données diversifiées et représentatives
Pour limiter les biais, les jeux de données doivent refléter la diversité des populations et des situations cliniques. Ils doivent intégrer des profils variés en termes d’âge, de sexe, d’antécédents médicaux ou encore de contextes pathologiques. Une représentation insuffisante de certaines catégories de patients peut conduire à des performances inégales du modèle et à des résultats moins fiables pour certains groupes [1].
Des données de qualité et correctement gouvernées
La qualité des données constitue un autre prérequis majeur. Les informations utilisées pour entraîner une intelligence artificielle doivent être exactes, structurées, documentées et régulièrement mises à jour. Dans le domaine de la santé, le Règlement Général sur la Protection des Données (RGPD) impose également des exigences strictes en matière de traitement des données personnelles, notamment des données de santé, afin de garantir leur sécurité et leur utilisation licite [2].
Une approche fondée sur la transparence et la gestion des risques
L’encadrement réglementaire européen renforce également les exigences applicables aux systèmes d’intelligence artificielle. L’AI Act classe notamment certains systèmes d’IA utilisés dans le domaine de la santé parmi les applications à haut risque et impose des obligations relatives à la gouvernance des données, à la documentation, à la supervision humaine et à la gestion des risques [3].
Les organisations internationales soulignent par ailleurs que la confiance dans l’IA en santé repose sur la robustesse des données d’entraînement, la transparence des modèles et l’évaluation continue de leurs performances [4].
Construire une IA de confiance pour la biologie médicale
En biologie médicale, la question n’est pas uniquement de disposer de grandes quantités de données, mais de s’assurer qu’elles sont pertinentes, représentatives et gouvernées de manière responsable. La capacité à développer des systèmes d’intelligence artificielle fiables repose ainsi sur un équilibre entre innovation, qualité des données, conformité réglementaire et supervision humaine. C’est à cette condition que l’IA pourra accompagner durablement les laboratoires dans la valorisation des données de santé et l’amélioration des pratiques médicales.
Références
- [1] Organisation mondiale de la santé (OMS), Ethics and Governance of Artificial Intelligence for Health, 2021.
- [2] Règlement (UE) 2016/679 du Parlement européen et du Conseil du 27 avril 2016 relatif à la protection des données à caractère personnel (RGPD).
- [3] Règlement (UE) 2024/1689 du Parlement européen et du Conseil du 13 juin 2024 établissant des règles harmonisées concernant l’intelligence artificielle (AI Act).
- [4] Organisation de coopération et de développement économiques (OCDE), Artificial Intelligence in Health: Opportunities for Responsible Adoption, 2023.
