• Najnowsze pytania
  • Bez odpowiedzi
  • Zadaj pytanie
  • Kategorie
  • Tagi
  • Zdobyte punkty
  • Ekipa ninja
  • IRC
  • FAQ
  • Regulamin
  • Książki warte uwagi

Pytanie odnośnie zajmowanej ilości bajtów przez znaki

Object Storage Arubacloud
0 głosów
452 wizyt
pytanie zadane 31 października 2019 w Offtop przez Iam Nowicjusz (150 p.)
Dzień dobry wszystkim,
Mam pytanie następujące - ile bajtów informacji / w pamięci zajmuje mi napisanie zwykłej litery alfanumerycznej, ile taki znak "" (gdy kopiuję ten znak do gry to mam małe literki w środku kwadratu), a ile litera chińska/hinduska?

Informacje te są mi potrzebne, gdyż potrzebuję policzyć kilka rzeczy związane z exploitem do gry Minecraft, gdzie, żeby móc ten exploit zainicjować, potrzebuję w jednym chunku mieć jeden megabajt informacji, a zapisywanie wielu książek z tymi znakami jest właśnie najbardziej efektywną metodą.

Policzenie kilku rzeczy mi jest potrzebne, gdyż wszystkie znaki, które są poza ISO 8859-2 są blokowane (exploit został spowolniony w wykonywaniu), więc byłbym niezmiernie wdzięczny, gdybym dostał informacje na podane w pierwszym akapicie pytania.
Pozdrawiam i miłego dnia,
Arek
komentarz 31 października 2019 przez DragonCoder Nałogowiec (36,500 p.)
1. Znak 8 bitow, 1 bajt

2. Ta koperta to chyba emoji, a emoji maja wlasny rozmiar, zalezny od jej wielkosci chyba itd.

3. http://ascii-table.com/keyboard.php/468-1

I sprawdz konwertujac sobie na binarke

2 odpowiedzi

0 głosów
odpowiedź 31 października 2019 przez tkz Nałogowiec (42,000 p.)
wybrane 2 listopada 2019 przez Iam
 
Najlepsza
Ogólnie ciężko na to pytanie odpowiedzieć. Najlepszą odpowiedzią było by "to zależy", tylko jest mało szczegółowa. A więc, teoretycznie od 8 bitów przy ASCII, idąc dalej masz utf-8, a tutaj to w praktyce ruletka. Zestawów znaków ze znakami niełacińskimi zakodowanymi w górnej połowie będą dwa razy większe. W przypadku niektórych skryptów, takich jak tajski i dewanagari znaki będą trzykrotnie większe. Istnieją nawet przykłady, w których pojedynczy bajt zamienia się w znak złożony w Unicode, a zatem jest sześciokrotnie większy w UTF-8. Spowodowało to sprzeciw w Indiach i innych krajach.
0 głosów
odpowiedź 31 października 2019 przez obl Maniak (51,280 p.)
  • 0x00 do 0x7F            – bity 0xxxxxxx, gdzie kolejne „x” to bity – licząc od najwyższego
  • 0x80 do 0x7FF           – bity 110xxxxx 10xxxxxx
  • 0x800 do 0xFFFF         – bity 1110xxxx 10xxxxxx 10xxxxxx
  • 0x10000 do 0x1FFFFF     – bity 11110xxx 10xxxxxx 10xxxxxx 10xxxxxx
  • 0x200000 do 0x3FFFFFF   – bity 111110xx 10xxxxxx 10xxxxxx 10xxxxxx 10xxxxxx
  • 0x4000000 do 0x7FFFFFFF – bity 1111110x 10xxxxxx 10xxxxxx 10xxxxxx 10xxxxxx 10xxxxxx

Nawet wikipedia odpowiada na takie pytania. Do zapisu znaków specjalnych wykorzystuje się najczęściej UTF-8 które ma konstrukcję jak powyżej. Polskie znaki specjalne mieszczą się w dwóch bajtach ale bardziej egzotyczne znaki już nie mają takiego szczęścia.

komentarz 31 października 2019 przez adrian17 Ekspert (346,320 p.)

kilka rzeczy związane z exploitem do gry Minecraft

W Javie, z tego co wiem, kodowanie stringów jest w UTF-16; więc zakładając że to Javowa wersja MC i że faktycznie używa zwykłych Javowych stringów, to jest jakaś szansa że to o to kodowanie chodzi.

Podobne pytania

+2 głosów
2 odpowiedzi 166 wizyt
0 głosów
1 odpowiedź 248 wizyt
pytanie zadane 3 czerwca 2016 w HTML i CSS przez uMAXa Gaduła (4,290 p.)
+2 głosów
12 odpowiedzi 582 wizyt
pytanie zadane 2 listopada 2015 w Offtop przez Sedi Stary wyjadacz (10,200 p.)

92,694 zapytań

141,606 odpowiedzi

320,106 komentarzy

62,052 pasjonatów

Motyw:

Akcja Pajacyk

Pajacyk od wielu lat dożywia dzieci. Pomóż klikając w zielony brzuszek na stronie. Dziękujemy! ♡

Oto polecana książka warta uwagi.
Pełną listę książek znajdziesz tutaj.

Akademia Sekuraka

Niedawno wystartował dodruk tej świetnej, rozchwytywanej książki (około 940 stron). Mamy dla Was kod: pasja (wpiszcie go w koszyku), dzięki któremu otrzymujemy 10% zniżki - dziękujemy zaprzyjaźnionej ekipie Sekuraka za taki bonus dla Pasjonatów! Książka to pierwszy tom z serii o ITsec, który łagodnie wprowadzi w świat bezpieczeństwa IT każdą osobę - warto, polecamy!

...