Comprendre l'encodage UTF-8
UTF-8 est l'encodage de caractères le plus utilisé sur le web (plus de 98% des sites). Il représente chaque caractère Unicode en 1 à 4 octets : les caractères ASCII classiques (a-z, 0-9) utilisent un seul octet, les caractères accentués français (é, è, ê) utilisent 2 octets, et les emojis utilisent 3 ou 4 octets. Connaître la représentation UTF-8 de vos caractères est essentiel pour le débogage, la manipulation de données binaires et la compréhension des problèmes d'encodage.
Formats d'encodage proposés
L'outil propose trois formats d'affichage : hexadécimal (0xC3 0xA9 pour "é"), pratique pour le débogage réseau et les protocoles ; décimal (195 169 pour "é"), utilisé dans certains langages de programmation ; et code points Unicode (U+00E9 pour "é"), le format standard pour identifier les caractères Unicode indépendamment de l'encodage.