Inoltre Unicode definisce addirittura cio che tipo di chiama “Unicode transformation format” (UTF) e “Universal character arnesi” (UCS): questi non sono altre che razza di le codifiche necessarie verso la panorama esterna di Unicode.
Delle diverse codifiche definite e usate nella scusa di Unicode, mi limitero a menzionare le ancora importanti (che tipo di sono di nuovo laquelle usate con piuttosto del 90% dei casi).
UTF-16 (gia UCS-2, descritta nel materiale avanti come codifica U): una trascrizione multibyte come permette la esibizione dell’intero catalogo Unicode ed che rappresenta l’intero BMP (65536 codepoint) durante una trascrizione di segno “wide” costituita da paio byte (questa epoca l’originale regole UCS-2, che epoca per classe di visualizzare il single BMP). Laddove UTF-16 di nuovo UCS-2 sono piu volte confuse, UTF-16 e l’unica di usanza presente. Sopra UTF-16 ogni segno viene codificato sopra una sequela di statura instabile da 2 verso quattro ottetti (byte), riservando le codifiche verso quattro byte a codepoint rarissimi gestiti tramite “codepoint surrogati”.
Sopra UTF-8 qualunque temperamento viene sanzionato per una sequenza di statura mutevole da 1 per quattro ottetti (byte)
UTF 16 definisce anche certain preciso valore (Byte-Order-Mark oppure BOM) ad esempio si puo sentire per assimilare l’endianness usata nella codifica del testo.
Read More