Mediante buona sostanza, espressivita addirittura norme sono indistinguibili

Mediante buona sostanza, espressivita addirittura norme sono indistinguibili

Mediante buona sostanza, espressivita addirittura norme sono indistinguibili

A circa tutte le codifiche ISO, sinon fece durante appena quale i primi 127 codepoint corrispondessero ai codici ASCII, in appena da occupare insecable certi qualita di coesistenza in quest’ultimo.

Il processo fece alcune vittime (codifiche nazionali ancora industriali di varia titolo ad esempio non vennero recepite) ancora creo alcuni orrori (che tipo di, la regole Latin-1 e circa stesso, tuttavia non identica, al codepage windows-1252, un’ambiguita che razza di persiste ed quest’oggi).

Taluno degli effetti di codesto fascicolo ex evidenziare la necessita di regolamentare i codici esistenti mediante indivisible eccezionale repertorio per piacere di esprimere tutti i caratteri usati dall’uomo. Il somma dello analisi di certain catalogo di questo tipo gia la esecuzione di Unicode (di nuovo ne parleremo in mezzo a indivis po’)

Le codifiche

Ad esempio abbiamo detto con l’aggiunta di verso, i calcolatori trasmettono l’informazione con accordo minime chiamate byte (quando sono in rango di elaborarla facendo cenno ad un’unita addirittura eccetto detta bit: insecable cifra binaria che puo valere 0 ovvero 1)

Poiche un byte puo rendere visibile i numeri interi nell’intervallo 0-256, ogni espressivita contente certain preferibile di 256 codepoint puo abitare regolamentato (messo mediante forma esterna) utilizzando certain byte a segno. Per questi codici e dunque facile riconoscere spettacolo interna addirittura esterna, facendo ricompensare ad qualsiasi codepoint la distilla esibizione quale uno byte.

Esistono eppure lingue quale hanno (molti) ancora lettere dei 256 rappresentabili durante excretion singolo byte: il cinese ed il giapponese sono paio in mezzo a le con l’aggiunta di importanti. Le codifiche dei codici/codepage creati verso queste lingue presenta quindi la pressione di usare piu di certain byte verso inclinazione affare che razza di puo succedere tipo mediante perlomeno coppia modi – ancora entrambi sono stati usati in diversi codici di nuovo codifiche.

Codifiche wide-char.

La preferenza esteriormente piu usuale e quella di controllare lo proprio bravura di byte verso la Sudan le donne ci vogliono marito regole di ogni codepoint. Come, A indivis rilievo ad esempio abbia oltre a di 256 bensi minore di 65536 simboli, presente significa che tipo di qualsiasi inclinazione sara sanzionato per due byte, da 00000000-00000000 a 11111111-11111111. Codifiche di attuale risma si chiamano “wide-char” (scrittura larghi). Quantunque verosimilmente ancora immediatamente comprensibili, queste codifiche hanno indivis concetto certo, qualcuno inespresso di nuovo autorita che interessa innanzitutto i programmatori.

Insecable dimostrazione: UCS-2 (UTF-16)

Consideriamo, che razza di modello tutt’altro che possibile, una regole U cosi qualita (questa regole e fondamentalmente quella come, per UNICODE, e attitudine UCS-2).

2) U utilizza i primi 256 codepoint nello in persona pace anche con lo uguale senso del codepage latin-1. Questo significa che tipo di tutte le letteratura delle principali lingue europee occidentali sono contenute con certain celibe byte, il anteriore dei due.

Il primo argomentazione (quegli evidente) e l’inefficienza di U. U invero contiene 511 simboli che tipo di vengono codificati mediante sequenze che razza di hanno come minimo insecable byte vano. Tuttavia, laddove U viene utilizzata a cifrare testi costituiti da soli caratteri occidentali, questi risultano sentire il infido dello estensione (e vengono trasmessi nel infido del tempo) che razza di sarebbe doveroso, in quanto tutti i alfabeto occidentali hanno una trascrizione se il byte piu caratteristico e irrilevante.

Il secondo argomentazione (colui fuorche rapporto) e generale ad esempio questione dell’endianness. La ragionamento endianness addirittura la terminologia associata derivano dai nomi di due fazioni politiche che esistevano nelle favolose isole di Lilliput ed Blefuscu (che tipo di racconta Swift ne i “Viaggi di Gulliver”) i cui membri sinon distinguevano per l’estremita da cui iniziavano ad attaccare le uova: quella grande (a Lilliput, a bando del monarca che razza di una turno si era registrato aprendo insecable uovo dall’estremita oltre a piccolo: big endians) ovverosia quella marmocchia (a Blefuscu, a reazione contro il regnante: little endians). Circa questa diversita (addirittura sulla coula diritto regio), eta scoppiata frammezzo a le paio isole una antagonismo sanguinosa luogo bravi lillipuziani addirittura blefuscudiani si scannavano durante stuolo. Sopra gamma pianificatore, l’endianness ha dato causa verso grattacapi minore sanguinosi, pero addirittura piuttosto idioti di quelli provocati per Lilliput.

about the author: