stringtranslate.com

Неразрывный пробел

В обработке текста и цифровом наборе текста неразрывный пробел ( )  , также называемый NBSP , требуемый пробел , [1] жесткий пробел или фиксированный пробел (в большинстве шрифтов он не имеет фиксированной ширины ), представляет собой символ пробела , который предотвращает автоматический перенос строки в своей позиции. В некоторых форматах, включая HTML , он также предотвращает схлопывание последовательных пробельных символов в один пробел. Существуют также символы неразрывного пробела с другой шириной.

Использование и вариации

Несмотря на то, что его расположение и использование схожи с таковыми у пробела , он отличается по контекстному поведению. [2] [3]

Ненарушающее поведение

Текстовые процессоры обычно предполагают, что автоматический перенос строки может быть вставлен в любом месте, где встречается пробел; неразрывный пробел предотвращает это (при условии, что программное обеспечение распознает символ). Например, если текст «100 км» не помещается в конце строки, программное обеспечение может вставить перенос строки между «100» и «км». Редактор, который считает такое поведение нежелательным, может выбрать использование неразрывного пробела между «100» и «км». Это гарантирует, что текст «100 км» не будет разорван: если он не помещается в конце строки, он полностью переносится на следующую строку.

Неколлапсирующее поведение

Второе распространенное применение неразрывных пробелов — в форматах простых текстовых файлов, таких как SGML , HTML , TeX и LaTeX , чьи движки рендеринга запрограммированы на обработку последовательностей пробельных символов (пробел, новая строка, табуляция, подача формы и т. д.) так, как если бы они были одним символом (но это поведение можно переопределить). Такое «схлопывание» пробелов позволяет автору аккуратно расположить исходный текст, используя переносы строк, отступы и другие формы интервалов, не влияя на конечный результат набора . [4] [5]

Напротив, неразрывные пробелы не объединяются с соседними пробельными символами при отображении. Поэтому они могут использоваться автором для простой вставки дополнительного видимого пробела в результирующий вывод без использования интервалов, стилизованных с особыми значениями свойства CSS " white-space". И наоборот, неразборчивое использование (см. рекомендуемое использование [ необходима цитата ] в руководствах по стилю ), в дополнение к обычному пробелу, дает лишнее пространство в выводе.

Изменение ширины

Другие неразрывные варианты, определенные в Unicode :

U+202F УЗКИЙ НЕРАЗРЫВНЫЙ ПРОБЕЛ () NNBSP
Из-за более тесной связи значения и единицы как непрерывного визуального элемента NNBSP рекомендуется для использования в стандарте SI . [6] Он был введен в Unicode 3.0 для монгольского языка, [7] чтобы отделить суффикс [8] от основы слова без указания границы слова. Он также требуется для большой пунктуации (иногда неточно называемой «двойной пунктуацией») во французском языке, где он называется espace fine insécable (перед ;, ?, !, », и после «, ; сегодня часто (т. е. во французском DTP, называемом [9] новой школой) также перед :) и в немецком языке между многочастными сокращениями (например, « z. B. », « d. h. », « v. l. n. r. »). [10] При использовании с монгольским языком его ширина обычно составляет одну треть обычного пробела; в других контекстах его ширина составляет около 70% от обычного пробела, но может напоминать ширину тонкого пробела (U+2009), по крайней мере, с некоторыми шрифтами. [11] Кроме того, начиная с версии 34 Unicode Common Locale Data Repository (CLDR), NNBSP используется в числах в качестве разделителя групп во французском языке, [12] а начиная с версии 44, [13] в венецианском языке. [14] Испанский язык склонен делать то же самое. [15]
U+2007 ПРОСТРАНСТВО ДЛЯ ФИГУР ( )
Создает пробел, равный цифре (0–9).
U+2060 ОБЪЕДИНИТЕЛЬ СЛОВ (· )  WJ
Кодируется в Unicode с версии 3.2. Слово joiner не создает пробелов и запрещает перенос строки в своей позиции.

Пример

В браузерах изменение размера окна продемонстрирует эффект неразрывных пробелов в текстах ниже.

Чтобы продемонстрировать неразрывный эффект неразрывного пробела, следующие слова были разделены неразрывными пробелами:

Lorem Ipsum Dolor Sit Amet Consectetur Adipiscing Elit Sed Do Eiusmod Tempor Incididunt Ut Labore Et Dolore Magna Aliqua Ut Enim Ad Minim Veniam Quis Nostrum Exercitation Ullamco Laboris Nisi Ut Aliquip Ex Ea Commodo Consequat Duis Aute

Чтобы продемонстрировать несворачивающееся поведение неразрывного пробела, следующие слова были разделены увеличивающимся количеством неразрывных пробелов:

Lorem Ipsum Dolor Sit Amet Consectetur Adipiscing Elit Sed Do Eiusmod Tempor Incididunt Ut Labore Et Dolore Magna Aliqua Ut Enim Ad Minim

Напротив, следующие слова разделяются обычными пробелами:

Lorem Ipsum Dolor Sit Amet Consectetur Adipiscing Elit Sed Do Eiusmod Tempor Incididunt Ut Labore Et Dolore Magna Aliqua Ut Enim Ad Minim Veniam Quis Nostrum Exercitation Ullamco Laboris Nisi Ut Aliquip Ex Ea Commodo Consequat Duis Aute

Здесь они разделены узкими неразрывными пробелами, чтобы показать их ширину:

Lorem Ipsum Dolor Sit Amet Consectetur Adipiscing Elit Sed Do Eiusmod Tempor Incididunt Ut Labore Et Dolore Magna Aliqua Ut Enim Ad Minim Veniam Quis Nostrum Exercitation Ullamco Laboris Nisi Ut Aliquip Ex Ea Commodo Consequat Duis Aute

Кодировки

В Unicode метка порядка байтов (BOM), U+FEFF, может интерпретироваться как «неразрывный пробел нулевой ширины», но является устаревшей альтернативой средству объединения слов (U+2060).

Методы ввода с клавиатуры

Редко бывает, чтобы национальные или международные стандарты раскладок клавиатур определяли метод ввода неразрывного пробела. Исключением является финская многоязычная клавиатура, принятая в качестве национального стандарта SFS 5966 в 2008 году. Согласно SFS 5966, неразрывный пробел можно ввести с помощью комбинации клавиш AltGr + Space . [16]

Обычно авторы драйверов клавиатуры и прикладных программ (например, текстовых процессоров ) придумывают собственные сочетания клавиш для неразрывного пробела. Например:

Помимо этого, приложения и среды часто имеют методы ввода сущностей Unicode напрямую через их кодовую точку , например, с помощью метода ввода Alt Numpad . (Неразрывный пробел имеет кодовую точку 255десятичного формата ( FFhex) в кодовой странице 437 и кодовой странице 850 и кодовую точку 160десятичного формата ( A0hex) в кодовой странице 1252. )

Смотрите также

Примечания

  1. ^ В целях наглядности, в этой статье обычный пробел заменен на неразрывный пробел.
  2. ^ Копирование/вставка символа, показанного здесь, приведет к переносу светло-голубого цвета вместе с символом. Этого можно избежать, используя один из методов, описанных в § Методы ввода с клавиатуры.
  3. ^ В системах Windows 10 + по умолчанию переключает конфигурации клавиатуры, если для текущего языка настроено более одной клавиатуры.Ctrl⇧ Shift

Ссылки

  1. ^ IBM (1998) [1995]. "Windows, Latin 1". РЕЕСТР, Наборы графических символов и кодовые страницы . CPGID 01252.
  2. ^ Elyaakoubi, Mohamed; Lazrek, Azzeddine (2010). «Justify Just или Just Just Justify». Журнал электронных изданий . 13. doi : 10.3998/3336451.0013.105 . hdl : 2027/spo.3336451.0013.105 .
  3. ^ "Специальные символы". Чикагское руководство по стилю онлайн.
  4. ^ "Структура", HTML 4.01 , W3, 1999-12-24.
  5. ^ "Текст", CSS 2.1 , W3.
  6. ^ «Стандарт СИ, упоминающий вставку неразрывного пробела между значением и единицей измерения» (PDF) .
  7. ^ ISO/IEC 10646-1:1993/FDAM 29:1999(E)
  8. ^ «Монгольские суффиксы, связанные с NNBSP» (PDF) . В3 . 28 декабря 2014 г.
  9. ^ claude72 (25 апреля 2005 г.). «Опечатка: акцентированные заглавные буквы». Форум App Store и приложения > Приложения Mac > Créationgraphicique . МакГенерация. п. 5 . Проверено 30 марта 2019 г.{{cite web}}: CS1 maint: числовые имена: список авторов ( ссылка )
  10. Сольбриг, Амели (30 января 2008 г.). «Zweisprachige Mikrotypografie» (PDF) (на немецком языке). Hochschule für Technik, Wirtschaft und Kultur Leipzig. п. 58 (PDF, стр. 113). Архивировано из оригинала (PDF) 11 марта 2016 г. Проверено 10 июня 2018 г. Alle Abkürzungen mit Binnenpunkten werden im Deutschen mit einem gFL [geschütztes Flexibles Leerzeichen] spationiert. [...] Die English Schreibweise sieht keine Abstände zwischen einzelnen Buchstaben vor. Nach einem Binnenpunkt folgt demnach ohne gFL sofort der nächste Buchstabe.
  11. ^ "Системы письма и пунктуация" (PDF) . Стандарт Unicode 7.0 . Unicode Inc. 2014 . Получено 2014-11-02 .
  12. ^ "Заметка о выпуске CLDR 34".
  13. ^ "Заметка о выпуске CLDR 44".
  14. ^ «CLDR v44.0 — Таблица по типу: Числа:Символы».
  15. ^ РАЭ; РАЭ. «Пунто | Паниспанский словарь дураков». «Diccionario Panhispánico de dudas» (на испанском языке) . Проверено 7 января 2022 г.
  16. ^ Kotoistus (2006-12-28), Uusi näppäinasettelu [ Статус новой раскладки клавиатуры ] (презентация) (на финском и английском языках), CSC – IT Center for Science , архивировано с оригинала 2011-07-27{{citation}}: CS1 maint: отсутствует местоположение издателя ( ссылка ). Проекты финской многоязычной клавиатуры.
  17. ^ Python Software Foundation. "Unicode HOWTO¶". Документация Python 3.10.6 . Получено 19 августа 2022 г.