Espaço de largura zero

O espaço de largura zero (​) (em inglês: zero-width space, abreviado ZWSP) é um caractere de controle usado em formatação de texto para indicar limites de palavras para sistemas de processamento de texto quando usando scripts que não usam espaçamento explícito, ou depois de caracteres (como a barra), que não são seguidos por um espaço visível, mas após o qual pode haver uma quebra de linha. Também é usado com idiomas sem espaço visível entre as palavras, por exemplo, japonês.[1] Normalmente, não é uma separação visível, mas pode se expandir em passagens totalmente justificadas.[2]

Uso

Nas páginas HTML, o espaço de largura zero pode ser usado como uma possível quebra de linha em palavras longas, como uma alternativa ao elemento <wbr>. No entanto, o espaço de largura zero não é suportado em alguns navegadores da Web, como versões antigas do Internet Explorer (versões 6 e anteriores).[3]

Para mostrar o efeito do espaço de largura zero, as seguintes palavras foram separadas por espaços de largura zero: 
Lorem​Ipsum​Dolor​Sit​Amet​Consectetur​Adipiscing​Elit​Sed​Do​Eiusmod​Tempor​Incididunt​Ut​Labore​Et​Dolore​Magna​Aliqua​Ut​Enim​Ad​Minim​Veniam​Quis​Nostrud​Exercitation​Ullamco​Laboris​Nisi​Ut​Aliquip​Ex​Ea​Commodo​Consequat​Duis​Aute​Irure​Dolor​In​Reprehenderit​In​Voluptate​Velit​Esse​Cillum​Dolore​Eu​Fugiat​Nulla​Pariatur​Excepteur​Sint​Occaecat​Cupidatat​Non​Proident​Sunt​In​Culpa​Qui​Officia​Deserunt​Mollit​Anim​Id​Est​Laborum

E as seguintes palavras não são separadas por esses espaços:

LoremIpsumDolorSitAmetConsecteturAdipiscingElitSedDoEiusmodTemporIncididuntUtLaboreEtDoloreMagnaAliquaUtEnimAdMinimVeniamQuisNostrudExercitationUllamcoLaborisNisiUtAliquipExEaCommodoConsequatDuisAuteIrureDolorInReprehenderitInVoluptateVelitEsseCillumDoloreEuFugiatNullaPariaturExcepteurSintOccaecatCupidatatNonProidentSuntInCulpaQuiOfficiaDeseruntMollitAnimIdEstLaborum

Nos navegadores que suportam espaços com largura zero, o redimensionamento da janela irá quebrar novamente o primeiro texto apenas nos limites das palavras, enquanto o segundo texto não será quebrado.

Blacklisting em URLs

As regras da ICANN proíbem que nomes de domínio incluam caracteres não exibidos, como espaço de largura zero, e a maioria dos navegadores bloqueia seu uso em nomes de domínio, porque eles podem ser usados para criar um ataque homográfico, onde um URL malicioso é visualmente indistinguível de um legítimo.[4][5]

O caractere de espaço com largura zero é codificado em Unicode como U+200B ZERO WIDTH SPACE (&NegativeMediumSpace;, &NegativeThickSpace;, &NegativeThinSpace;, &NegativeVeryThinSpace;, &ZeroWidthSpace;).[6]

A representação TeX é \hskip0pt; a representação do LaTeX é \hspace{0pt};[7] e a representação groff é \:[8]

Sua semântica e implementação de HTML são semelhantes ao hífen suave .

Ver também

  • Espaço (pontuação)

Referências

  1. «Zones spéciales et caractères de formatage» [Special areas and formatting characters] (pdf). Hapax Quebec (em francês). Cópia arquivada (PDF) em 27 de dezembro de 2015. Les espaces sans chasse sont conçues pour les langues qui ne séparent pas les mots à l’aide d’espaces visibles, comme le thaï ou le japonais. 
  2. The Unicode Standard 6.1, p. 366
  3. «Alex Dunae » Better Web Typography with Spaces and Hyphens» 
  4. «Network.IDN.blacklist_chars - mozillaZine» 
  5. «Unicode Character 'ZERO WIDTH SPACE' - FileFormat.Info» 
  6. «General Punctuation – Unicode» (PDF). Consultado em 20 de julho de 2013 
  7. «The LaTeX Companion. Chapter 3: Basic Formatting Tools» (PDF) 
  8. «groff(7) – Linux manual page» 

Fontes

  • Unicode Consortium, "Special Areas and Format Characters" (Chapter 16), The Unicode Standard, Version 5.2 .full text
  • Victor H. Mair, Yongquan Liu, Characters and computers, IOS Press, 1991.
  • Portal da linguística