Des données ouvertes pour l’IA

Il est temps d’investir, encore et toujours

Jaimie Boyd
8 min readMay 29, 2021

J’adore les données ouvertes!

Aujourd’hui, je vous propose un pitch : investir dans les données ouvertes parce qu’elles permettent d’améliorer les technologies du gouvernement. Et de meilleures technologies gouvernementales signifient de meilleurs services pour les gens et donc, une meilleure qualité de vie.

Cela vaut la peine d’y réfléchir, non? Aujourd’hui, je vais me concentrer sur les données ouvertes pour l’intelligence artificielle.

Contexte : les robots sont parmi nous

À l’ère du numérique, les algorithmes sont plus courants que jamais. Les algorithmes et les nouvelles méthodes d’analyse des données offrent des possibilités de services numériques et de connaissances exceptionnelles. Mais l’usage de certains algorithmes entraîne également des risques.

L’automatisation est de plus en plus courante… et cela peut se traduire par une foule de bienfaits!

Les données ouvertes peuvent aider à prévenir certains des risques liés aux algorithmes. Elles peuvent rendre les algorithmes plus efficaces et plus éthiques, de façon à produire de meilleurs résultats pour nos communautés et les personnes touchées par les nouvelles technologies.

Je tiens à vous faire part de quelques considérations sur la création et l’utilisation d’algorithmes, en particulier dans le secteur public. J’aimerais également établir un lien avec les données ouvertes et encourager les gouvernements à continuer d’investir dans les données ouvertes en tant que catalyseur des technologies émergentes.

Que sont les données ouvertes?

Les données ouvertes sont des données auxquelles nous pouvons tous facilement accéder, ainsi que les utiliser, les manipuler et les partager pour quelque raison que ce soit. Il s’agit généralement de données gouvernementales lisibles par machine. Les gouvernements prennent leurs données, les nettoient, en vérifient la sécurité et la confidentialité, puis les publient sur des portails comme celui du gouvernement de la Colombie‑Britannique et celui du gouvernement du Canada.

Les données ouvertes constituent un outil essentiel pour tout gouvernement numérique. Elles favorisent la transparence, la responsabilisation et la collaboration au sein d’un écosystème. Ce type d’échange est important si l’on veut que le gouvernement numérique soit efficace et durable.

De plus en plus, ces données ouvertes permettent également de réaliser des avancées novatrices époustouflantes. Et cela peut contribuer à rendre les algorithmes plus utiles, légitimes et éthiques.

L’IA est là, au sein de votre gouvernement

Les ordinateurs n’ont jamais été aussi rapides et bon marché. À l’heure où cette tendance s’accélère, les gens innovent, y compris lorsqu’il s’agit de simuler l’intelligence humaine. L’intelligence artificielle (IA) n’est au fond que l’utilisation de machines pour accomplir des tâches qui sont traditionnellement du ressort des cerveaux humains. Cela inclut des tâches comme l’application de règles à grande échelle, le repérage de tendances, le raisonnement et l’utilisation de données pour apprendre et se perfectionner.

L’usage de l’IA est de plus en plus courant dans l’administration publique. Je vois beaucoup d’innovation dans l’apprentissage automatique (le machine learning), ce qui est la base des systèmes qui apprennent automatiquement en consommant et en analysant des données. Des progrès fascinants!

L’IA offre de nombreux avantages, notamment dans le secteur public où je travaille. Au sein du gouvernement de la Colombie-Britannique, nous l’utilisons pour estimer la durée des trajets en autobus, améliorer la façon dont nous réglementons les systèmes et les équipements de sécurité et faciliter le travail des interprètes judiciaires multilingues et interactifs. Ce sont là d’excellents exemples provenant de la côte ouest du Canada, mais il y en a beaucoup d’autres à l’échelle planétaire. L’IA aide les gens à accomplir des tâches comme remplir leur déclaration de revenus, repérer les entreprises qui risquent de faire faillite, prédire les décès liés aux opioïdes et déceler les infractions à la réglementation.

Ne baissez pas la garde, les menaces ne dorment jamais : les risques liés à l’IA

Je suis emballée à l’idée que l’IA puisse jouer un rôle important dans le secteur public. Le gouvernement numérique consiste à utiliser les nouvelles technologies de l’ère de l’Internet pour fournir aux citoyens des services de qualité dignes de leur confiance. L’IA peut aider à le faire efficacement et d’une façon qui répond aux besoins de nos diverses communautés.

Cela dit, l’IA comporte de nombreux risques. Dans le cas des particuliers, on constate que l’IA est utilisée pour la reconnaissance faciale. Ces cas d’utilisation peuvent créer des risques d’atteinte à la vie privée. Par exemple, la reconnaissance faciale peut donner accès à des services (notamment des étudiants qui se livrent à un contrôle de reconnaissance faciale à Shenzhen!), mais elle peut aussi aider les entités à recueillir des tonnes de données personnelles. Ces données pourraient permettre d’obtenir des renseignements auxquels les particuliers ne s’attendaient pas ou auxquels ils n’avaient pas consenti.

L’intelligence artificielle (IA) peut également porter atteinte à la légitimité et à l’équité. Il existe des milliers de cas d’erreurs d’identité dues à une reconnaissance faciale inexacte. Ces erreurs peuvent concerner des personnes très diverses, des supporters violents de soccer aux écoliers. Prenez, par exemple, les tribunaux qui reposent sur l’IA en Chine. Certains des risques sont terribles. Les données que nous introduisons dans les algorithmes sont souvent biaisées, et ces algorithmes produisent des résultats biaisés à leur tour. Les gens sont en droit de s’attendre à mieux.

Maintenant que nous pouvons tout faire, que ferons-nous? (Bruce Mau)

Il est rassurant de voir les gouvernements parler et prendre des mesures pour combattre certains des risques en matière d’éthique associés aux algorithmes. Le gouvernement du Canada a établi une Directive sur la prise de décisions automatisée. La RGPD de l’Europe (GDPR en anglais) et le cadre des droits civils (lien en anglais) du Brésil nous rapprochent d’une manière saine de gérer les risques liés à l’IA. Les gouvernements se sont mis à adopter l’éthique, notamment la ville d’Edmonton qui a récemment nommé un conseiller en éthique des données et de l’analytique. Bravo!

Ce sont d’excellentes initiatives. Mais dans l’ensemble, le secteur public doit redoubler d’efforts en matière de protection des données et de droits numériques. Il doit élaborer ces éléments en tenant compte de l’opinion des citoyens. Au Canada, nous savons que plus les effets sont intimes, moins les gens aiment l’IA (consultez le merveilleux travail d’Ipsos sur le sujet, en particulier les diapositives 22 à 24). Les gouvernements devraient agir en conséquence.

Les données ouvertes peuvent aider

Dans un nouveau monde courageux où nous utilisons l’IA et sommes confrontés à ses risques, il existe d’immenses possibilités d’appliquer systématiquement des directives en matière d’éthique. AI Global et d’autres organisations ont commencé à adopter des approches fantastiques dans ce domaine. Les nouveaux principes relatifs au numérique du gouvernement de la Colombie‑Britannique renforcent notre engagement envers l’éthique dans l’application des technologies émergentes.

Pour parfaire ces engagements et guides en matière d’éthique, les gouvernements doivent redoubler d’efforts sur le plan des données ouvertes. Les données sont l’élément vital de l’IA. Sans données, les algorithmes ne sont que des reflets hypothétiques de la société, offrant peu de perspectives exploitables. Les données ouvertes offrent d’excellentes opportunités pour l’IA. En voici quelques-unes :

  • Formation — Pour être utile, l’IA doit assimiler un grand nombre de données. Les données ouvertes sont souvent très riches et offrent un potentiel inexploité. Par exemple, lors de l’élaboration du 4e Plan d’action national du Canada pour un gouvernement ouvert, les fonctionnaires ont fait participer plus de 10 000 Canadiens et ont publié leurs commentaires anonymes sous forme de données ouvertes. N’est‑ce pas génial? Ce contenu peut servir de données de formation pour les algorithmes qui analysent les données de consultation non structurées.
  • Nature explicable et reproductible — Pour être légitimes, les entités qui appliquent des algorithmes doivent être en mesure d’expliquer de quelle façon elles les utilisent. Ces entités doivent également être en mesure de produire les mêmes résultats de façon cohérente à partir des mêmes données. Dans un monde où un si grand nombre de renseignements précieux proviennent de données qui pourraient avoir des ramifications sur la vie privée, il est utile de pouvoir démontrer la viabilité d’un algorithme en utilisant des données ouvertement disponibles.
  • Transparence — Nous avons tous entendu parler de Heidi et Howard, et des préjugés inconscients que nous apportons souvent à la prise de décision. Lorsque nous élaborons des algorithmes à l’aide de données ouvertes, nous rendons plus apparents les préjugés de nos données héritées. Et cela nous permet de les corriger. À l’échelle de la société, les algorithmes biaisés risquent d’être plus faciles à rectifier que les personnes biaisées. L’accès facile et public aux données qui alimentent les algorithmes permet à un plus grand nombre de personnes d’examiner lesdites données.
  • Légitimité — Les données présentent de nombreux risques en matière de confidentialité et de sécurité, et les algorithmes peuvent mettre en lumière et exacerber ces risques. Mais grâce à des protocoles robustes et des normes en matière de données, les données ouvertes font systématiquement l’objet d’examens qui anonymisent les données et les regroupent à un niveau susceptible d’atténuer les risques. La formation d’algorithmes fondés sur des données ouvertes peut donc prévenir les problèmes liés à la protection des données.
  • Facilité — Les données sont désordonnées et c’est d’ailleurs la raison pour laquelle les spécialistes des données disposent de nombreuses techniques pour nettoyer les données et les rendre plus faciles à analyser. Cependant, il sera toujours plus facile de tirer des enseignements de données qui se conforment déjà aux normes de données établies. C’est ce que font les données ouvertes.

La technologie est géniale, mais il faut savoir l’utiliser plutôt que de la laisser vous mettre à son service. (Prince)

Notre nouveau monde, courageux et technologique, est riche en algorithmes, et c’est une bonne chose. Mais pour que les investissements dans la transformation numérique soient légitimes et durables, ces algorithmes doivent se conformer aux normes en matière d’éthique. Les données ouvertes peuvent aider à ce chapitre.

Les arguments en faveur des données ouvertes sont solides. Les données ouvertes favorisent l’innovation, contribuent à la création de grandes entreprises et permettent aux communautés de demander des comptes au gouvernement. Dans un monde où la technologie évolue et s’améliore à un rythme effréné, les données ouvertes sont un puissant catalyseur d’algorithmes éthiques.

Mettons les bouchées doubles : il est temps d’investir dans les données ouvertes, maintenant et toujours.

Gracieuseté de @OA_Button

Cet article m’a été inspiré par une table ronde organisée lors de la quatorzième réunion annuelle du Forum sur la gouvernance de l’Internet, un forum multipartite sanctionné par les Nations Unies pour favoriser le dialogue politique sur les questions de gouvernance de l’Internet. La table ronde s’intitulait Human-centered Design and Open Data : How to Improve AI [Conception axée sur l’humain et données ouvertes : comment améliorer l’IA].

Je tiens à remercier mes collègues du Brazilian Center for the Study of Web Technologies (Ceweb.br) [Centre brésilien pour l’étude des technologies Web] d’avoir tenu une discussion aussi importante.

--

--

Jaimie Boyd

National Digital Government Leader at Deloitte Canada