Многие символы, которых нет на стандартной компьютерной клавиатуре, будут полезны — даже необходимы — для многих страниц и для изданий Википедии на других языках. Эта страница содержит рекомендации о том, какие символы безопасно использовать и как их вводить.
См. Справка:Ввод специальных символов .
Большинство современных браузеров имеют определенный уровень поддержки Unicode, но некоторые делают это лучше, чем другие. Наиболее часто встречающаяся проблема заключается в том, что браузеры, работающие в Windows XP, полагаются на предварительно настроенные ссылки шрифтов в реестре, а не на реальный поиск шрифта, который может отображать рассматриваемый символ. Это означает, что браузер часто приходилось заставлять использовать определенные шрифты. В английской Википедии есть набор шаблонов для этого. Например, {{ IPA }} для международного фонетического алфавита . Материал из списка глифов Windows 4 должен быть безопасным для использования без таких специальных мер.
Поддержка Unicode расширена путем установки дополнительного автономного пакета обновления Windows KB2729094 [1] , доступного как для 32-разрядной , так и для 64-разрядной версии Windows 7 SP1 из Центра загрузки Microsoft. Этот бэкпорт из Windows 8 обновляет шрифт Segoe UI , добавляя поддержку браузера для Emoji и других символов в Windows 7. Дополнительные символы Emoji можно установить, скопировав файл шрифта Segoe UI Emoji, seguiemj.ttf, с другого компьютера под управлением Windows 8 или более поздней версии на компьютер с Windows 7. Более новые версии Windows предоставляют больше символов эмодзи, чем старые версии.
Для отображения Unicode или специальных символов на веб-странице(ах) необходимо, чтобы на вашем компьютере присутствовал или был установлен один или несколько шрифтов Unicode . Для правильной работы функциональности также необходимо изменить настройку или конфигурацию или параметры программного обеспечения браузера для просмотра веб-страниц.
Специальные символы должны отображаться правильно без дополнительной настройки в Konqueror , Opera , Safari и большинстве других последних браузеров. Необязательный шаг, который можно предпринять для лучшего (и правильного) отображения символов с лигатурными формами, комбинированными символами , после выполнения ранее упомянутых шагов, — это установка программного обеспечения движка рендеринга .
Для отображения отдельных специальных символов вместо char можно использовать десятичные или шестнадцатеричные числовые коды сущностей HTML . Если необходимо отобразить абзац с большим количеством специальных символов Unicode, то можно также использовать ... или ....<p class="Unicode">
</p>
<span class="Unicode">
</span>
Используется class="Unicode"
в веб-страницах, HTML или тегах wiki, где необходимо отобразить различные символы из широкого спектра различных блоков Unicode. Если специальные символы, которые необходимо отобразить на веб-страницах, в основном охватывают меньшее количество блоков Unicode, связанных с латинским алфавитом , то class="latinx"
можно использовать. Для специальных символов или символов, связанных с международным фонетическим алфавитом , class="IPA"
можно использовать. Для политонических (греческих) символов или связанных с ними символов class="polytonic"
можно использовать.
Некоторые свободно доступные шрифты, которые включают много блоков Unicode , — это TITUS Cyberbit Basic и GNU Unifont . Статья о шрифтах Unicode дает более общий обзор с помощью этой таблицы . Если вы уже знаете, какие конкретные блоки нужны, этот раздел может быть более полезным. Большинство статей о конкретных скриптах включают информацию о соответствующем блоке Unicode.
Примечание: Многие веб-сайты (включая сайты Wikimedia) по умолчанию используют шрифты с засечками или без засечек в зависимости от элемента страницы (например, заголовки могут по умолчанию использовать шрифты с засечками, а основной текст — без засечек), поэтому может потребоваться использовать пользовательские стили CSS, если вы хотите переопределить это и принудительно установить определенный шрифт.
Google Chrome позволяет пользователю устанавливать шрифты по умолчанию для обычного, serif, sans-serif и моноширинного режимов отображения. Можно использовать любой шрифт, установленный в системе. Чтобы получить доступ к этой настройке, щелкните значок параметров с тремя точками в правом верхнем углу окна браузера и выберите Настройки . Прокрутите до раздела Внешний вид и щелкните Настроить шрифты . Здесь вы можете выбрать любые шрифты в вашей системе для использования в качестве шрифтов по умолчанию.
В Mozilla Firefox , чтобы изменить шрифт, вам нужно открыть окно настроек через меню «Инструменты» или кнопку меню. На панели «Общие» прокрутите до пункта «Шрифты и цвета» и выберите подходящий шрифт. Обычно должен быть доступен любой шрифт, установленный в вашей системе. Вы также можете нажать «Дополнительно», чтобы отключить пользовательские шрифты и выбрать другие шрифты для пропорциональных, с засечками, без засечек и моноширинных, но это, похоже, требуется не всегда.
Шрифтом по умолчанию для латинских алфавитов в старых версиях веб-браузера Internet Explorer (IE) для Windows является Times New Roman . Более старые версии шрифта не включают много блоков Unicode . Чтобы выбрать другой шрифт, следуйте этому пути из строки меню IE : Сервис > Свойства обозревателя > (вкладка Общие >) Шрифты > Шрифт веб-страницы:
к прокручиваемому списку шрифтов и выберите другой шрифт, например Lucida Sans Unicode , а затем нажмите OK .
например, финикийский алфавит , древнеиталийский алфавит , линейное письмо Б и т. д.
Пожалуйста, загрузите и установите один из этих свободно лицензионных шрифтов.
Если вы используете Linux на основе Debian (например, Ubuntu, Linux Mint), они должны быть уже установлены по умолчанию. Если нет, загрузите и установите пакет deb ttf-ancient-fonts
, введя в терминале :
sudo apt-get install ttf-ancient-fonts
Большинство символов IPA не включены в наиболее широко используемую форму Times New Roman (хотя они включены в версию, поставляемую с Windows Vista ), шрифт по умолчанию для латинских скриптов в Internet Explorer для Windows . Чтобы правильно отображать символы IPA в этом браузере, необходимо настроить его на использование шрифта , включающего символы расширений IPA. К таким шрифтам относятся Lucida Sans Unicode , который поставляется с Windows XP ; Gentium , Charis SIL , Doulos SIL , DejaVu Sans или TITUS Cyberbit , которые находятся в свободном доступе ; или Arial Unicode MS , который поставляется с Microsoft Office . На этой странице мы заставили Internet Explorer использовать такой шрифт по умолчанию, поэтому он должен отображаться правильно, но это еще не было сделано для всех других страниц, содержащих IPA. Это также относится к другим страницам, использующим специальные символы. Помните об этом, если вы видите в статьях символы ошибок, такие как «». Это также происходит с бывшей испанской N с маленькой N сверху (Nᷠ nᷠ), яньялифской N с выносным элементом (Ꞑ ꞑ) и вариантами второго умляута волапюк для A, O и U (Ꞛ ꞛ, Ꞝ ꞝ и Ꞟ ꞟ). Google Chrome и другие браузеры на базе Chromium в Windows имеют проблему в системе возврата шрифтов, когда списки шрифтов для каждого сценария жестко закодированы. Chromium предполагает, что эти шрифты должны быть всегда доступны, поэтому ищет эти шрифты, в основном специфичные для ОС, через их системные шрифты и не может быть настроен пользователем, кроме как изменить шрифты по умолчанию для стилей standard, serif, sans-serif и fixed-width, тем самым снижая гибкость. Таким образом, некоторые нераспознаваемые новые символы нельзя исправить просто установкой подходящих внешних шрифтов, требуя от пользователей обновления своей операционной системы до тех, которые содержат отсутствующие символы в одном из системных шрифтов. [2] [3] Специальные символы должны отображаться правильно без дополнительной настройки в Mozilla Firefox , Konqueror , Opera , Safari и большинстве других современных браузеров.
Начиная с MediaWiki 1.5, все проекты используют кодировку символов Unicode ( UTF-8 ) . До конца июня 2005 года, когда эта новая версия стала использоваться в проектах Wikimedia, английская, голландская, датская и шведская Wikipedia использовали Windows-1252 (они объявили себя ISO-8859-1 , но на самом деле браузеры считают их синонимами, а программное обеспечение MediaWiki не предпринимало никаких попыток предотвратить использование символов, эксклюзивных для windows-1252). Дообновленный вики-текст в их базах данных сохраняется в Windows-1252 и преобразуется при загрузке (часть его также могла быть преобразована постепенными изменениями в способе хранения истории). Изменения, внесенные после обновления, будут сохраняться в базе данных как UTF-8. Этот процесс преобразования при загрузке невидим для пользователей. Он также невидим для повторных пользователей, поскольку Wikimedia теперь использует дампы XML, а не дампы базы данных.
€
, ссылка на десятичный символ €
и ссылка на шестнадцатеричный символ €
. Поле редактирования показывает введенный код, веб-страница — полученный символ. Недоступные символы, которые копируются в поле редактирования, сначала отображаются как символ и автоматически преобразуются в их десятичные коды при предварительном просмотре или публикации изменений.é
, хотя и разрешен, не нужен.Обратите внимание, что Special:Export экспортирует с использованием UTF-8, даже если база данных закодирована в ISO 8859-1, по крайней мере, так было в случае с английской Википедией, уже когда она использовала версию 1.4. Чтобы узнать, какой набор символов применяется в проекте, используйте функцию браузера «Просмотр исходного кода» и найдите что-то вроде этого:
<meta http-equiv="Content-type" content="text/html; charset=iso-8859-1"/>
или
<meta http-equiv="Content-type" content="text/html; charset=utf-8"/>