Internet Multilingue et Sémantique
Un article de Wiki ISOC de la gouvernance de l'internet .
L'habitude a donné le nom d'internet aux moyens de la continuité d'échanges de l'écosystème numérique mondial assistés et facilités par ordinateur. La gestion de son héritage logique (Internet Legacy) a été confiée par le SMSI (Sommet Mondial pour la Société de l'information) aux USA. La concertation de ses émergences techniques et de son intergouvernance relève du FGI (Forum de la Gouvernance de l'Internet) et leur gestion de la Coopération Renforcée entre les parties prenantes concernées au sein de cette intergouvernance réunissant de manière égale les acteurs du domaine régalien, de la société civile, du secteur privé, des organisations internationales et de la communauté technique et normative.
Les émergences principales actuelles concernent :
- un changement de paradigme architectural du "network centrique/centré sur le réseau" vers une architecture capable de supporter une société "people centric, à caractère humain, centrada en la persona".
- la multilinguisation pour permettre d'égales conditions d'accès à la connaissance et à la relation
- le développement des technologies de facilitation qui concernent la strate sémantique, le transport du sens (interintelligibilité) "psi à psi", et l'aide à l'intercompréhension (pragmatique).
Sommaire |
L'Internet Legacy
Introduction Générale
L'Internet est la superstructure logique décentralisée qui opère les datacommunications d'une concaténation internationale d'infrastructures physiques en général centralisées de lignes de télécommunications et de réseaux locaux privés. Son propos est d'assurer l'interopérabilité de bout en bout de processeurs numériques selon des protocoles de transferts de datagrames utilisant la commutation de paquets pour disposer d'interconnexions partagées de prise à prise. Il utilise pour cela le protocole non fiable "IP" (ce qui veut dire que des datagrames peuvent se perdre ou être corrompus), fiabilisé par des solutions comme TCP qui s'assurent du renvoi et du bon séquençage des datagrames. Au dessus de TCP/IP il inclut une couche de services pour une gestion spécialisée des types d'échanges (Telnet : accès direct; FTP : transfert de fichiers; SMTP : messageries; HTTP : web, etc.).
Le IANA
L'unité opérationnelle de la proposition Internet est assurée par la centralisation de ses référentiels au sein de la base du IANA actuellement administrée par l'ICANN. Elle réunit les paramètres de l'Internet dans quatre domaines :
- la numérotation des blocs d'adresses IP (géré par l'ICANN)
- le nommage du DNS (géré par l'ICANN)
- l'ensemble des paramètres des protocoles (géré par l'IETF)
- le registre des "subtags" linguistiques (LSR) délégué à la gestion d'une liste privée d'un Membre du Conseil d'administration d'UNICODE.
La maintenance technique de la technologie de l'Internet
La superstructure internet est une stabilisation prototype datant du 1er janvier 1983 de l'architecture d'ARPANET. Cette architecture n'a pas été modifiée depuis : elle reste marqué par son "biais linguistique" (utilisation de l'anglais dans le coeur de ses protocoles) et l'absence de couche présentation (cf. modèle OSI). Elle est maintenue par l'IETF (Internet Engineering Task Force) dont la mission [RFC 3935] est d'"influencer la manière dont l'on construit, utilise et gère l'internet pour qu'il marche mieux" en sachant que la technologie ainsi spécifiée "n'est pas celle qui pourrait être, mais celle qui correspond aux valeurs centrales de l'IETF" qui correspondent à l'introduction technique ci-dessus. Le développement architectural est dévolu à l'IAB dont les préoccupations vis-à-vis du financement de la recherche internet et les priorités techniques sont définies par la [RFC 3869]. La recherche à long terme est assurée par l'IRTF.
Evolution vers l'Internet Multilingue et Sémantique
Le support de la diversité linguistique
Il existe à travers le monde environ 20.000 entités linguistiques identifiables. La norme ISO 639-3 en recense 6.500. Parmi ces langues environ 150 sont des langues administratives et donc normatives pour le commerce et l'industrie. Elles sont documentées par la norme ISO 3166 qui est le référentiel mondial reconnu par tout le monde cybernétique depuis 1978 (à la suite du choix de "UK" au lieu de "GB" par les Postes britanniques (BPO) en 1977). Cette norme donne les codes ASCII des pays utilisés pour la formation des suffixes des ccTLD.
L'ICANN a demandé qu'elle fournisse le nom des pays non seulement en langue locale (actuellement romanisés) mais aussi en écriture locale. Ceci est en cours.
Les deux options techniques
Pour le support des utilisateurs de langue non anglo-saxonne, deux grandes options sont proposées.
- la mondialisation ("globalization") [doctrine du 'shaping the world' pour un e-commerce compris comme signifiant "English inside"] qui a été copiée dans bien d'autres secteurs. Elle est proposée par le consortium Unicode (IBM, Microsoft, Google, Yahoo!, Bibliothèques américaines). Elle consiste en :
- l'internationalisation du médium anglais : extension du code ASCII à tous les jeux de caractères pour que les solutions prévues pour l'anglais puissent encapsuler les autres langues.
- l'étiquetage des contenus : ceci va permettre d'informer les ordinateurs du contexte linguistique et commercial du contenu envoyé/reçu et de router les utilisateurs vers les contenus des langues qui leurs sont les "plus proches".
- la localisation des processeurs qui va permettre de décapsuler ce qui revient à la langue de l'ordinateur.
- la multilinguisation qui va s'attacher à permettre la capacitation technique de chaque langue au même niveau que l'anglais aujourd'hui.
Le cout et l'impact stratégique des modifications nécessaires semblant peu attrayants aux Anglo-saxons ils ont tenté de faire prévaloir la mondialisation sur la multilinguisation.
- l'internationalisation prédomine largement dans le monde informatique dont les besoins linguistiques sont réduits
- l'IETF a documenté l'étiquetage des langues et assure sous gestion Unicode la base de données IANA correspondante, mais dans des conditions hautement disputées qui ont préservé une interopérabilité de départ avec l'ISO
- la proposition très active présentée par le Royaume-Uni d'une "internationalisation" de la norme ISO 3166 qui est l'exemple prototype des techniques de multilinguisation n'a été supportée que par les seuls USA et Irlande et a donc été refusée par l'ISO/TC46. De nombreux travaux en cours et la position affirmée de l'ICANN lors du débat préparatoire à cette consultation (en ligne avec celle du SMSI) montrent que la multilinguisation n'est maintenant plus remise en cause.
La standardisation nécessaire
Il va sans dire que le multilinguisme unanimement considéré comme une priorité technique, culturelle et sociétale au sein du SMSI et de l'UNESCO est un challenge technique :
- qui commence par la proposition d'un nommage internet multilingue où nous devons et voulons tous Aider à définir les noms de domaine ISO 10646 en français
- et se poursuivra par une évolution du système de référentiel de l'Internet pour qu'il devienne multilingue.
La strate Sémantique
La strate sémantique est celle des métacoms qui se préoccupent d'interintelligibilité psi à psi au dessus de l'interconnectibilité prise à prise des signaux télécoms et de l'interopérabilité de bout en bout des contenus datacoms. La sémantique est le sens linguistique donné pour l'énonciateur, la pragmatique c'est le sens compris par le destinataire dans son contexte. On peut parler de sens absolu et de sens relatif.
Cette strate fortement présente dans la première technologie du réseau mondial (Tymnet), réclame une sécurité et un support du concept d'espace relationnel (les réseaux relationnels du réseau logique des réseaux physiques) qui réclame la couche présentation du modèle OSI dont ne dispose pas la technologie actuelle de l'IETF.
Une des applications sémantiques de l'Internet est celle du DNS (système de nommage qui associe la sémantique des noms de domaine à l'adressage numérique IP). La limitation ASCII du coeur protocolaire de l'Internet lui pose des problèmes pour le support d'un nommage linguistique.
L'autre application sémantique est l'e-mail qui souffre aussi très fortement de l'absence de couche présentation (le spam).
La strate sémantique est de ce fait reléguée au niveau applicatif, avec l'application notoire du Web Sémantique et tout le champs de développement des ontologies programmables et de leur interopérabilité selon la série de norme ISO 11179 du JTC1/SC32/WG2 concernant les registres de métadonnées (une ontologie est une encyclopédie dynamique munie de ses hyperliens. Ex. DNS ou Wikipedia).
Il est probable que le développement de l'Internet se fera par et pour le support des services de facilitation (aide à l'inter représentation pragmatique et à la compréhension du sens) entre interlocuteurs (traductions, référentiels communs, gestion du contexte relationnel, etc.)
