Вопросы по теме 'surrogate-pairs'

Почему UTF-32 вместо UTF-16, если у нас есть суррогатные пары?
Если я правильно понимаю, UTF-32 может обрабатывать все символы вселенной. То же самое можно сказать и о UTF-16, используя суррогатные пары. Так есть ли веская причина использовать UTF-32 вместо UTF-16?
4276 просмотров
schedule 23.04.2023

Обработка суррогатных значений Unicode в строках Java
Рассмотрим следующий код: byte aBytes[] = { (byte)0xff,0x01,0,0, (byte)0xd9,(byte)0x65, (byte)0x03,(byte)0x04, (byte)0x05, (byte)0x06, (byte)0x07, (byte)0x17,(byte)0x33, (byte)0x74,...
9176 просмотров
schedule 04.06.2023

Вывод UTF-16? Немного застрял
У меня есть некоторые символы в кодировке UTF-16 в форме суррогатной пары. Я хочу вывести эти суррогатные пары в виде символов на экране. Кто-нибудь знает, как это возможно?
4301 просмотров
schedule 18.11.2023

Python: получение правильной длины строки, если она содержит суррогатные пары
Рассмотрим следующий обмен на IPython: In [1]: s = u'華袞與緼????同歸' In [2]: len(s) Out[2]: 8 Правильный вывод должен был быть 7 , но поскольку пятый из этих семи китайских символов имеет высокий код Unicode, он представлен в UTF-8 «суррогатной...
4808 просмотров
schedule 25.11.2022

Weka: Как реализовать суррогатное разделение в дереве решений J48?
Может ли кто-нибудь помочь мне реализовать альтернативную обработку отсутствующих значений в алгоритме J48 с использованием Weka API в Java. Я уверен, что использовать подходы предварительного вменения перед обучением J48 несложно. Но как насчет...
668 просмотров

Python: найти эквивалентную суррогатную пару из символа юникода, отличного от BMP
Ответ представлен здесь: Как работать с суррогатными парами в Python? говорит вам, как преобразовать суррогатную пару, такую ​​как '\ud83d\ude4f' , в один символ Юникода, отличный от BMP (ответ будет "\ud83d\ude4f".encode('utf-16',...
3400 просмотров

С++: как поддерживать суррогатные символы в utf8
У нас есть приложение, написанное в базовой кодировке utf-8, и оно поддерживает utf-8 BMP (3 байта). Однако есть требование, когда он должен поддерживать суррогатные пары. Я где-то читал, что суррогатные символы не поддерживаются в utf-8. Это...
2064 просмотров

Является ли String.Replace(string,string) Unicode безопасным в отношении суррогатных пар?
Я пытаюсь найти лучший способ создать функцию, эквивалентную String.Replace("oldValue","newValue"); , которая может обрабатывать суррогатные пары. Меня беспокоит то, что если в строке есть суррогатные пары и существует вероятность того, что строка...
227 просмотров
schedule 31.07.2022