Hoeveel bits of bytes bevat een teken?

Hoeveel bits of bytes zijn er per “teken”?


Antwoord 1, autoriteit 100%

Het hangt ervan af wat het karakter is en in welke codering het is:

  • Een ASCII-teken in 8-bits ASCII-codering is 8 bits (1 byte), hoewel het in 7 bits past.

  • Een ISO-8895-1-teken in ISO-8859-1-codering is 8 bits (1 byte).

  • Een Unicode-teken in UTF-8-codering ligt tussen 8 bits (1 byte) en 32 bits (4 bytes).

  • Een Unicode-teken in UTF-16-codering ligt tussen 16 (2 bytes) en 32 bits (4 bytes), hoewel de meeste gebruikelijke tekens 16 bits in beslag nemen. Dit is de codering die intern door Windows wordt gebruikt.

  • Een Unicode-teken in UTF-32-codering is altijd 32 bits (4 bytes).

  • Een ASCII-teken in UTF-8 is 8 bits (1 byte) en in UTF-16 – 16 bits.

  • De extra (niet-ASCII) tekens in ISO-8895-1 (0xA0-0xFF) zouden 16 bits in beslag nemen in UTF-8 en UTF-16.

Dat zou betekenen dat er tussen 0,03125 en 0,125 tekens in een bit zitten.


Antwoord 2, autoriteit 8%

Er zijn 8 bits in een byte (normaal gesproken in Windows).

Als je echter met karakters te maken hebt, hangt dit af van de karakterset/codering. Unicode-tekens kunnen 2 of 4 bytes zijn, dus dat zou 16 of 32 bits zijn, terwijl Windows-1252soms onjuist genoemd ANSI is slechts 1 bytes, dus 8 bits.

In de Aziatische versie van Windows en enkele andere, draait het hele systeem in double-byte, dus een teken is 16 bits.

BEWERKT

Volgens Matteo’s opmerking gebruiken alle hedendaagse versies van Windows 16-bits intern per teken.

LEAVE A REPLY

Please enter your comment!
Please enter your name here

three × 1 =

Other episodes