3.66 , Michael Shigorin ( ok ), 13:15, 17/08/2017 [^] [^^] [^^^] [ответить] + / – > У KOI8, внезапно, есть куча разных подвидов: KOI8-R, KOI8-U, KOI8-T, KOI8-C, KOI8-O,

> KOI8-S, KOI8-E, KOI8-F. Ещё KOI8-RU была и KOI8-UB, помнится.

4.78 , saahriktu ( ok ), 14:46, 17/08/2017 [^] [^^] [^^^] [ответить] –4 + / – Затем, что не всем и не всегда нужен юникод. Да и юникодных кодировок, внезапно, тоже больше чем одна: UTF-8, UTF-16, UTF-32,... UTF-8 форсят из за совместимости с ASCII, но разный вес символов в байтах усложняет низкоуровневый парсинг строк. UTF-32 парсить легче, но она, в отличие от KOI8-R и UTF-8, несовместима с ASCII. Когда-нибудь, вероятно, и останется одна единственная кодировка, но будет это уже после похорон UTF-8 и ASCII, когда наступит царство UTF-32 или какой-нибудь UTF-64/UTF-128. А пока что ASCII и однобайтные кодировки продолжают жить, позволяя жить и UTF-8.

5.90 , Crazy Alex ( ok ), 17:26, 17/08/2017 [^] [^^] [^^^] [ответить] +2 + / – Для тех (доовольно экзотичных, кстати) случаев, когда нужен произвольный доступ и памяти хватает - преобразуйте в UTF-32, кто ж против. Но на входе/выходе - уж извольте UTF-8, ставший стандартом де-факто. И тут наплевать, плох он лии хорош - лучше одна плохая кодировка, чем две хороших.

6.135 , tmp170825 ( ? ), 13:58, 25/08/2017 [^] [^^] [^^^] [ответить] +1 + / – А почему, кстати, экзотичных? Вот в популярной ICU, например, в качестве "точки вращения" используют 16-bit Unicode. Функция, которая конвертирует, из произвольной кодировки в произвольную же ucnv_convert(), открывает два конвертера, одной из сторон которых обязательно будет 16-bit Unicode. А что на входе/выходе -- программисту по идее всё-равно должно быть, т. к. функция одна на все кодировки. Непонятно чем одна "плохая" кодировка лучше, чем много "хороших".

5.129 , fi ( ok ), 12:59, 21/08/2017 [^] [^^] [^^^] [ответить] + / – ну ты загнул! "после похорон UTF-8" в качестве KO: UTF-8 и UTF-32 ака UCS-4 - одна и таже кодировка Unicode :)))))) RTFM

6.133 , saahriktu ( ok ), 17:00, 24/08/2017 [^] [^^] [^^^] [ответить] + / – Нет, UTF-8 и UTF-32 - разные кодировки. В UTF-8 каждый ASCII символ занимает 1 байт, но другие code point'ы занимают от 2-х до 6-ти байт. Это транспортная самосихронизирующаяся кодировка со служебной информацией (не только текстовыми данными). В UTF-32 каждый code point фиксированно 4 байта. Независимо от того ASCII это или нет. Эта кодировка уже не является транспортной, и в ней нет служебной информации.

