Какой символ Юникода используется для обозначения комбинирования символов?

Мое приложение должно отображать осиротевшие комбинированные символы. Я хотел бы использовать тот же формат, что и официальные диаграммы Unicode, используя заполнитель в виде пунктирного круга. См., Например:

Быстрый просмотр графиков, и я нашел U + 25CC ТОЧЕЧНЫЙ КРУГ. Выглядит неплохо, но примечание к этому персонажу гласит:

обратите внимание, что ссылочный глиф для этого символа намеренно больше, чем глиф с пунктирным кругом, используемый для обозначения комбинирования символов в этом стандарте; см., например, 0300

Это говорит (я думаю), что U + 25CC - неправильный персонаж. (Или, если это так, возможно, просто плохо сформулированное примечание.)

Итак: если пунктирный кружок, использованный на комбинированных диакритических знаках, не равен U + 25CC, какой правильный код для этого маленького бугера?

Я пытался:

  • Копирование текста из PDF и его проверка, но копирование в PDF отключено.
  • Отправляю его себе по электронной почте в Gmail, а затем просматривая вложение как HTML, но оно преобразуется в U + 0024 (ЗНАК ДОЛЛАРА). Это означает, что либо преобразование не удалось, либо они просто играют в игры с рендерингом шрифтов в PDF.

[Уточнение] Я понимаю, что U + 25CC выглядит нормально (если его поддерживает шрифт), но похоже, что в спецификации указано, что это неправильный символ. Многие символы Unicode имеют похожие глифы, но с семантической точки зрения являются разными символами. Латинская заглавная буква A (U + 0041) и греческая заглавная буква Alpha (U + 0391) будут выглядеть одинаково для большинства шрифтов, но они имеют разное семантическое значение и не взаимозаменяемы.


person Dave Mateer    schedule 08.02.2010    source источник
comment
Большинство шрифтов действительно включают глиф с пунктирным кругом, если он нужен для алфавита и т. Д., Которые они покрывают. Но глифы не обязательно сопоставлять с кодовыми точками! Многие шрифты сопоставляют такие внутренние глифы с частным использованием Unicode, что означает, что они, вероятно, сильно различаются от шрифта к шрифту. Таким образом, вы могли бы получить его, используя доступ к шрифтам низкого уровня. Но также может быть, что разные шрифты реализуют это по-разному, поэтому может даже не быть способа получить глиф, который работает со всеми шрифтами, у которых он есть. 25CC, вероятно, лучший вариант.   -  person hippietrail    schedule 21.09.2017


Ответы (2)


Я не думаю, что существует официальный символ-заполнитель. Я читал эту заметку, они выбрали U+25CC произвольно, исключительно для демонстрации. Затем в диаграмме, где указан «настоящий» пунктирный круг, они сделали он немного больше, чтобы подчеркнуть, что он не используется там в качестве заполнителя. (Или, может быть, они уменьшили его в других таблицах; как вы сказали, примечание плохо сформулировано.)

В любом случае, я не вижу причин не использовать U+25CC в качестве вашего заполнителя.

person Alan Moore    schedule 09.02.2010

Просто попробовал: создайте пустой файл .html, скопируйте текст и загрузите его в Firefox. Отображается как ожидалось (хотя я действительно не ожидал, что пробел + объединяющий символ будут отображаться правильно):

<html>
<body>
<font size="24pt">
&#x25CC;&#x0300;
&#x25CC;&#x0301;
&#x25CC;&#x0302;
&#x25CC;&#x0303;
<br/>
&#x0041;&#x0300;
&#x0041;&#x0301;
&#x0041;&#x0302;
&#x0041;&#x0303;
<br/>
&#x0020;&#x0300;
&#x0020;&#x0301;
&#x0020;&#x0302;
&#x0020;&#x0303;
</font>
</body>
</html>
person devio    schedule 08.02.2010
comment
Я добавил пояснение к своему первоначальному вопросу. Я понимаю, что U + 25CC выглядит правильно, но похоже, что это не тот символ, семантически говоря, согласно спецификации. - person Dave Mateer; 09.02.2010