ٳܲé
Un nouveau rapport et des lignes directrices pour maintenir la souveraineté des données autochtones qui s’inscrivent dans les développements de l'intelligence artificielle

L'UNESCO a lancé un rapport inédit afin de favoriser le développement technologique et la diffusion d'information culturellement sensibles, d’assurer la souveraineté des données de plus de 800 peuples autochtones d'Amérique latine et des Caraïbes et d’empêcher des appropriations culturelles inappropriées dans le cadre du développement accéléré de l'intelligence artificielle (IA).

Le rapport, « L'intelligence artificielle centrée sur les peuples autochtones : perspectives depuis l’Amérique latine et les Caraïbes », a été débattu pour la première fois lors du troisième Forum mondial contre le racisme et la discrimination, qui s'est tenu récemment à Sao Paulo, Brésil. Il encourage l'inclusion participative des communautés locales et autochtones, une exploitation appropriée des données respectant leur autonomie, propose des politiques publiques pour intégrer les perspectives des peuples autochtones dans toutes les phases du développement de l'IA et explore les meilleures pratiques, dont 5 expériences provenant du Mexique.
Le rapport des bureaux de l’UNESCO à Mexico et Montevideo couvre des régions où :
réside plus de 10% de la région autochtone mondiale
près de 30% de la population vit dans une situation d’extrême pauvreté
seulement 40% de la population possède des compétences informatiques basiques.
Mariana Lazos, responsable des projets et des opérations au Pit Policy Lab, une start-up ԻéԻ岹Գٱ C Minds qui a collaboré à l'étude, a déclaré lors de la première discussion publique du rapport au troisième Forum mondial de l'UNESCO contre le racisme et la discrimination que la fourniture des outils nécessaires aux individus autochtones permet et encourage leur participation aux développements de l'IA. Par exemple, au Mexique, un projet pilote lié à l’IA vise à rationaliser l'apprentissage et à renforcer la promotion du Tu'un Savi, troisième langue autochtone nationale.

La numérisation autonome des données autochtones est essentielle pour enregistrer, transmettre et revitaliser le patrimoine autochtone, en particulier auprès des jeunes générations. Cependant, leur participation directe est souvent limitée. Par conséquent, ces lignes directrices soulignent l’importance de la détermination des peuples autochtones, de la bonne gestion de leurs données pour répondre aux engagements des pays concernés en matière de diversité culturelle et linguistique, du droit à une éducation sensible à la réalité autochtone et de la poursuite d’un développement durable.
L’IA transforme nos sociétés, en particulier l’IA générative. C’est pourquoi, ses avancées doivent être éthiques et tenir compte des caractéristiques uniques des données autochtones et des droits des peuples autochtones à collecter, interpréter et utiliser leurs voix, images, représentations, connaissances, techniques, systèmes symboliques et linguistiques. Par exemple, il s’agit, entre autres, de lutter contre l’appropriation illicite de motifs textiles esthétiques et sacrés par le biais des développements technologiques.
La numérisation des données autochtones doit garantir leur droit à l’autodétermination et à la propre gouvernance de leurs données, à utiliser ces dernières selon leurs valeurs et leurs intérêts communs, leur libre consentement, préalable et éclairé à une participation collaborative, et enfin garantir leur vie privée et leurs droits à la propriété intellectuelle.
Les pratiques inspirées du Mexique et abordées plus en détail dans le rapport sont les suivantes :
Des chercheurs de l'Université autonome métropolitaine ont créé une proposition de textes générés par l’IA pour cataloguer et identifier des éléments de forme, esthétique et iconographiques des vêtements indigènes de la région des Altos de Chiapas, qui sont à même d'identifier les variations ou les plagiats. A research team at the Technological Institute of Coatzacoalcos in Veracruz developed a bot using Natural Language Processing (NLP) to assess the correct pronunciation of words in indigenous languages, collecting phonetic symbols from voice models.
Une équipe de recherche de l'Institut technologique de Coatzacoalcos de Veracruz a développé un robot utilisant le traitement du langage naturel (NLP) pour évaluer la prononciation correcte des mots dans les langues indigènes, en collectant des symboles phonétiques à partir de modèles vocaux.
Des chercheurs de l'Institut technologique d'Oaxaca ont généré une application pour l'apprentissage interactif de la langue Tu'un Savi, en utilisant l'informatique visuelle dans un modèle formé à l'IA pour fournir des informations sur la prononciation et l'écriture associées aux objets capturés par les caméras des appareils mobiles.
Une équipe de l'Institut des mathématiques et des systèmes appliqués de l'Université nationale autonome du Mexique (UNAM) a développé un système de traduction automatique issu de 11 familles de langues autochtones du Mexique en utilisant l'apprentissage automatique et l'apprentissage profond, en alimentant l'ordinateur avec des exemples concrets pour parvenir à générer des traductions. Leur proposition comprend la traduction depuis/vers le wixarika, le náhuatl, le yorém nokki, le p'urhepecha, le mexicana (variante du náhuatl) et l'espagnol.
Le Réseau de recherche féministe en intelligence artificielle (f<A+i>r), le Centre professionnel de conseil, de défense et de traduction autochtone (CEPIADET) et le Défenseur des droits de l'homme du peuple d'Oaxaca, a coordonné un projet visant à évaluer les techniques existantes de traduction automatique de dix langues autochtones d'Amérique. Une partie de ce projet comprenait la conception d'un agent conversationnel centré sur les expériences et les connaissances des interprètes de langues autochtones du Mexique. Selon l’évaluation, le système proposé était inadéquat car il ne répondait pas aux réalités des interprètes.