« UNICODE » : différence entre les versions
Aller à la navigation
Aller à la recherche
(Page créée avec « == Généralités == vignette Il n'y a pas que l'anglais dans le monde! Si si, même si notre français s'accommode sans trop de soucis à l'ASCII d'autres langues sont définitivement pas latines et ne savent pas. Le russe, l'arabe le chinois... (exemple ci-contre) Cela nous fait pas mal de caractères à coder : Ա ࠂ ࠂ ᚡ ... et y'en a d'autres! ») |
m (→Généralités) |
||
| Ligne 3 : | Ligne 3 : | ||
Il n'y a pas que l'anglais dans le monde! | Il n'y a pas que l'anglais dans le monde! | ||
Si si, même si notre français s'accommode sans trop de soucis à l'ASCII d'autres langues sont définitivement pas latines et ne savent pas. Le russe, l'arabe le chinois... (exemple ci-contre) | Si si, même si notre français s'accommode sans trop de soucis à [[ASCII|l'ASCII]] d'autres langues sont définitivement pas latines et ne savent pas. Le russe, l'arabe le chinois... (exemple ci-contre) | ||
Cela nous fait pas mal de caractères à coder : Ա ࠂ | Cela nous fait pas mal de caractères à coder : Ա ࠂ ô ᚡ ... et y'en a d'autres! | ||
On s'est mis d'accord pour créer le code UNICODE. https://www.compart.com/fr/unicode/ | |||
Chaque caractère à un numéro et on considère des blocs. | |||
* Pour les 127 premiers c'est le même numéro que l'[[ASCII]]. Tout va bien nos programmes en C resteront codés de la même façon! | |||
* Entre 128 et 255 on a des caractères dit ASCII étendu ou Latin 1. Ce sont les extensions à l'ASCII qui permettent d'écrire l'ensemble des langues européennes latines. | |||
On a ensuite beaucoup de blocs pour des multitudes de systèmes d'écritures mais aussi pour des usages spécifiques, scientifique, linguistiques... | |||
* L'un des derniers est le bloc des idéogrammes CJK unifiés (à partir de caractère 196 608 et pour les 4 939 suivants (ca va de 𰀀 196608 à 𱍊 201546) | |||
Version du 14 janvier 2026 à 14:31
Généralités
Il n'y a pas que l'anglais dans le monde!
Si si, même si notre français s'accommode sans trop de soucis à l'ASCII d'autres langues sont définitivement pas latines et ne savent pas. Le russe, l'arabe le chinois... (exemple ci-contre)
Cela nous fait pas mal de caractères à coder : Ա ࠂ ô ᚡ ... et y'en a d'autres!
On s'est mis d'accord pour créer le code UNICODE. https://www.compart.com/fr/unicode/
Chaque caractère à un numéro et on considère des blocs.
- Pour les 127 premiers c'est le même numéro que l'ASCII. Tout va bien nos programmes en C resteront codés de la même façon!
- Entre 128 et 255 on a des caractères dit ASCII étendu ou Latin 1. Ce sont les extensions à l'ASCII qui permettent d'écrire l'ensemble des langues européennes latines.
On a ensuite beaucoup de blocs pour des multitudes de systèmes d'écritures mais aussi pour des usages spécifiques, scientifique, linguistiques...
- L'un des derniers est le bloc des idéogrammes CJK unifiés (à partir de caractère 196 608 et pour les 4 939 suivants (ca va de 𰀀 196608 à 𱍊 201546)