Strona główna : Warunki oprogramowania : Definicja kodowania znaków

Kodowanie znaków

Podczas gdy my widzimy dokumenty tekstowe jako wiersze tekstu, komputery w rzeczywistości widzą je jako dwójkowy dane lub ciąg jedynek i zer. Dlatego też znaków w dokumencie tekstowym muszą być przedstawione za pomocą kodów numerycznych. W tym celu tekst jest zapisywany przy użyciu jednego z kilku typów kodowania znaków.

Najpopularniejsze typy kodowania znaków to ASCII i Unicode. Podczas gdy ASCII jest nadal obsługiwane przez prawie wszystkie edytory tekstu, Unicode jest częściej używany, ponieważ obsługuje większy zestaw znaków. Unicode jest często definiowany jako UTF-8, UTF-16 lub UTF-32, które odnoszą się do różnych standardów Unicode. UTF oznacza „Format transformacji Unicode”, a liczba wskazuje liczbę Bity używany do reprezentowania każdego znaku. Od początków komputerów postacie były reprezentowane przez co najmniej jednego bajt (8 bitów), dlatego różne standardy Unicode zapisują znaki będące wielokrotnościami 8 bitów.

Chociaż ASCII i Unicode to najpopularniejsze typy kodowania znaków, można również stosować inne standardy kodowania kodować pliki tekstowe. Na przykład istnieje kilka typów standardów kodowania znaków specyficznych dla języka, takich jak zachodnie, łacińskie, amerykańskie, japońskie, koreańskie i chińskie. Podczas gdy języki zachodnie używają podobnych znaków, języki wschodnie wymagają zupełnie innego zestawu znaków. Dlatego kodowanie łacińskie nie obsługuje symboli potrzebnych do przedstawienia tekstu ciąg po chińsku. Na szczęście współczesne standardy, takie jak UTF-16, obsługują wystarczająco duży zestaw znaków, aby przedstawiać zarówno zachodnie, jak i wschodnie litery i symbole.

TechLib - słownik komputerowy Tech Lib

Ta strona zawiera techniczną definicję kodowania znaków. Wyjaśnia w terminologii komputerowej, co oznacza kodowanie znaków i jest jednym z wielu terminów programowych w słowniku TechLib.

Wszystkie definicje na stronie TechLib są napisane tak, aby były dokładne pod względem technicznym, ale także łatwe do zrozumienia. Jeśli uznasz tę definicję kodowania znaków za pomocną, możesz odwołać się do niej, korzystając z linków cytowania powyżej.