« UNICODE » : différence entre les versions

De knowledge
Aller à la navigation Aller à la recherche
(Page créée avec « == Généralités == vignette Il n'y a pas que l'anglais dans le monde! Si si, même si notre français s'accommode sans trop de soucis à l'ASCII d'autres langues sont définitivement pas latines et ne savent pas. Le russe, l'arabe le chinois... (exemple ci-contre) Cela nous fait pas mal de caractères à coder : Ա ࠂ ࠂ ᚡ ... et y'en a d'autres! »)
 
Ligne 3 : Ligne 3 :
Il n'y a pas que l'anglais dans le monde!
Il n'y a pas que l'anglais dans le monde!


Si si, même si notre français s'accommode sans trop de soucis à l'ASCII d'autres langues sont définitivement pas latines et ne savent pas. Le russe, l'arabe le chinois... (exemple ci-contre)
Si si, même si notre français s'accommode sans trop de soucis à [[ASCII|l'ASCII]] d'autres langues sont définitivement pas latines et ne savent pas. Le russe, l'arabe le chinois... (exemple ci-contre)


Cela nous fait pas mal de caractères à coder : Ա ࠂ ࠂ ᚡ ... et y'en a d'autres!
Cela nous fait pas mal de caractères à coder : Ա ࠂ ô ᚡ ... et y'en a d'autres!
 
On s'est mis d'accord pour créer le code UNICODE. https://www.compart.com/fr/unicode/
 
Chaque caractère à un numéro et on considère des blocs.
 
* Pour les 127 premiers c'est le même numéro que l'[[ASCII]]. Tout va bien nos programmes en C resteront codés de la même façon!
 
* Entre 128 et 255 on a des caractères dit ASCII étendu ou Latin 1. Ce sont les extensions à l'ASCII qui permettent d'écrire l'ensemble des langues européennes latines.
 
On a ensuite beaucoup de blocs pour des multitudes de systèmes d'écritures mais aussi pour des usages spécifiques, scientifique, linguistiques...
 
* L'un des derniers est le bloc des idéogrammes CJK unifiés (à partir de caractère 196 608 et pour les 4 939 suivants (ca va de 𰀀 196608 à 𱍊 201546)

Version du 14 janvier 2026 à 14:31

Généralités

1280px-Writing Systems.png

Il n'y a pas que l'anglais dans le monde!

Si si, même si notre français s'accommode sans trop de soucis à l'ASCII d'autres langues sont définitivement pas latines et ne savent pas. Le russe, l'arabe le chinois... (exemple ci-contre)

Cela nous fait pas mal de caractères à coder : Ա ࠂ ô ᚡ ... et y'en a d'autres!

On s'est mis d'accord pour créer le code UNICODE. https://www.compart.com/fr/unicode/

Chaque caractère à un numéro et on considère des blocs.

  • Pour les 127 premiers c'est le même numéro que l'ASCII. Tout va bien nos programmes en C resteront codés de la même façon!
  • Entre 128 et 255 on a des caractères dit ASCII étendu ou Latin 1. Ce sont les extensions à l'ASCII qui permettent d'écrire l'ensemble des langues européennes latines.

On a ensuite beaucoup de blocs pour des multitudes de systèmes d'écritures mais aussi pour des usages spécifiques, scientifique, linguistiques...

  • L'un des derniers est le bloc des idéogrammes CJK unifiés (à partir de caractère 196 608 et pour les 4 939 suivants (ca va de 𰀀 196608 à 𱍊 201546)