• Najnowsze pytania
  • Bez odpowiedzi
  • Zadaj pytanie
  • Kategorie
  • Tagi
  • Zdobyte punkty
  • Ekipa ninja
  • IRC
  • FAQ
  • Regulamin
  • Książki warte uwagi

UTF-8 Odwołąnia znakowe

VPS Starter Arubacloud
0 głosów
533 wizyt
pytanie zadane 24 grudnia 2016 w HTML i CSS przez Jaaqob Stępień Użytkownik (760 p.)
Cześć, kiedyś kiedy oglądałem kurs HTML na Pasja Informatyk Przykuło moją uwagę że Pan Mirosław tłumaczył że należy korzystać z Kodowania UTF-8, a nie ISO 8859-2 mimo że w trakcie kursu nie korzystał z możliwość tego kodowania. Szczególnie mnie zastanawia czemu jak już korzystał z unicode to czemu liczbę π napisał przy pomocy encji?- a nie przy pomocy unicode (w win lewy alt+jakaś liczba dziesiętna, w Linux większość środowisk są wygodne tablice znaków i symbole matematyczne/fizyczne ukryte na klawiaturze. W Debianie AltGr+Q dają π). Czo to był błąd w kursie (moim zdaniem to zmniejsza czytelność i zwiększa nie potrzebnie ilość danych) czy ja coś przeoczyłem/pomyliłem?

1 odpowiedź

0 głosów
odpowiedź 24 grudnia 2016 przez Comandeer Guru (599,730 p.)

Specyfikacja HTML5 mówi prosto: de facto każde inne kodowanie niż UTF-8 jest zdeprecjonowane.

Authors should use UTF-8. Conformance checkers may advise authors against using legacy encodings. [RFC3629]

Co do encji zamiast znaczków: prawdę mówiąc encje pozwalają na wygodną pracę ze wszystkimi znaczkami we wszystkich edytorach. To nie jest błąd, bardziej IMO preferencja. 

komentarz 24 grudnia 2016 przez Jaaqob Stępień Użytkownik (760 p.)
UTF-8 owszem jest jednym z dwóch na chwilę obecnie najważniejszych kodowań obok UTF-16 tylko że piliki w tych kodowaniach jakby nie patrzeć są większe od kodowań narodowych pomijając języki które wykorzystują tylko podstawowe znaki ASCII w UTF-8, a argument że odwołania znakowe (wiem że to nie to samo, ale często używa się nie do końca poprawnie określenia encja) działają poprawnie w wszystkich edytorach do mnie nie trafia, bo znaki unkode działają poprawnie w wszystkich edytorach które mogą zapisywać w UTF-8, a znak unkode to trzy bajty, a encja przynajmniej 3, ale zwykle więcej i pozostaje argument czytelność gdy widzę w kodzie Ⰱ to się nie zastanawiam co to za znak, a gdy widzę &#11265 to muszę sprawdzić w tablicach, bo raczej nie znasz na pamięć wartość numerycznych znaków staro serbskich(miałem otwartą na nich tablicę, bo przepisałem krótki tekst). Zapomniałem że encje działają tylko w SGML, a unkody w wszystkich językach programowania.
komentarz 24 grudnia 2016 przez Comandeer Guru (599,730 p.)

UTF-8 owszem jest jednym z dwóch na chwilę obecnie najważniejszych kodowań obok UTF-16 tylko że piliki w tych kodowaniach jakby nie patrzeć są większe od kodowań narodowych pomijając języki które wykorzystują tylko podstawowe znaki ASCII w UTF-8

UTF-8 everywhere. Pamiętaj, że każde dodatkowe kodowanie to potrzeba jego wsparcia, a to mija się z celem jeśli istnieje jedno, uniwersalne. Kwestia standaryzacji. Większy rozmiar jest ceną za to, ale IMO bardzo niską.

znak unkode to trzy bajty

→ 4. Większość emojis ma 4 ;)

 znaki unkode działają poprawnie w wszystkich edytorach które mogą zapisywać w UTF-8

To zależy też od fonta. Da się znaleźć odpowiednie znaczki Unicode, które się wykrzaczą i źle wyświetlą.

gdy widzę &#11265 to muszę sprawdzić w tablicach, bo raczej nie znasz na pamięć wartość numerycznych snaków staro serbskich

Czasami są jednak encje nazwane. To już jednak zależy od specyficznego use case'u. Tak, staroserbski w numerycznych encjach to jakaś porażka. Niełamliwa spacja bez   tak samo ;) 

komentarz 24 grudnia 2016 przez Comandeer Guru (599,730 p.)

→ 4. Większość emojis ma 4 ;)

I tyle na temat poprawnego działania nie-encji ;)  Skopiowałem zwykłą buźkę i krzak. 

Podobne pytania

0 głosów
0 odpowiedzi 416 wizyt
0 głosów
1 odpowiedź 366 wizyt
pytanie zadane 8 kwietnia 2022 w JavaScript przez Riddick Bywalec (2,600 p.)
0 głosów
2 odpowiedzi 543 wizyt
pytanie zadane 22 czerwca 2021 w C i C++ przez rottingham Nowicjusz (140 p.)

92,452 zapytań

141,262 odpowiedzi

319,077 komentarzy

61,854 pasjonatów

Motyw:

Akcja Pajacyk

Pajacyk od wielu lat dożywia dzieci. Pomóż klikając w zielony brzuszek na stronie. Dziękujemy! ♡

Oto polecana książka warta uwagi.
Pełną listę książek znajdziesz tutaj.

Akademia Sekuraka

Akademia Sekuraka 2024 zapewnia dostęp do minimum 15 szkoleń online z bezpieczeństwa IT oraz dostęp także do materiałów z edycji Sekurak Academy z roku 2023!

Przy zakupie możecie skorzystać z kodu: pasja-akademia - użyjcie go w koszyku, a uzyskacie rabat -30% na bilety w wersji "Standard"! Więcej informacji na temat akademii 2024 znajdziecie tutaj. Dziękujemy ekipie Sekuraka za taką fajną zniżkę dla wszystkich Pasjonatów!

Akademia Sekuraka

Niedawno wystartował dodruk tej świetnej, rozchwytywanej książki (około 940 stron). Mamy dla Was kod: pasja (wpiszcie go w koszyku), dzięki któremu otrzymujemy 10% zniżki - dziękujemy zaprzyjaźnionej ekipie Sekuraka za taki bonus dla Pasjonatów! Książka to pierwszy tom z serii o ITsec, który łagodnie wprowadzi w świat bezpieczeństwa IT każdą osobę - warto, polecamy!

...