Пишу о программировании, книгах, науке и жизни

О кодировках в C++

20 мая 2015, 22:35

Грустная история забытых символов. Как не сойти с ума при работе с кодировками в C++

Журнал «Хакер» всегда умел писать интересные и подробные статьи.

Начнем с главного. Создатели языка си были минималистами. По сей день в стандарте C/C++ не предусмотрено типа «байт». Вместо этого типа используется тип char. Char означает character, иными словами — символ. Соответственно, говоря в С/С++ о типе char, мы подразумеваем «байт», и наоборот. Вот тут и начинается самое интересное. Дело в том, что максимально возможное число символов, кодируемых 8 битами, равно 256, и это при том, что на сегодняшний день в таблице Unicode насчитываются сотни тысяч символов.

http://habrahabr.ru/company/xakep/blog/257895/

Поделиться
Запинить
Популярное