• Najnowsze pytania
  • Bez odpowiedzi
  • Zadaj pytanie
  • Kategorie
  • Tagi
  • Zdobyte punkty
  • Ekipa ninja
  • IRC
  • FAQ
  • Regulamin
  • Książki warte uwagi

Pytanie odnośnie zajmowanej ilości bajtów przez znaki

0 głosów
192 wizyt
pytanie zadane 31 października 2019 w Offtop przez Iam Nowicjusz (150 p.)
Dzień dobry wszystkim,
Mam pytanie następujące - ile bajtów informacji / w pamięci zajmuje mi napisanie zwykłej litery alfanumerycznej, ile taki znak "" (gdy kopiuję ten znak do gry to mam małe literki w środku kwadratu), a ile litera chińska/hinduska?

Informacje te są mi potrzebne, gdyż potrzebuję policzyć kilka rzeczy związane z exploitem do gry Minecraft, gdzie, żeby móc ten exploit zainicjować, potrzebuję w jednym chunku mieć jeden megabajt informacji, a zapisywanie wielu książek z tymi znakami jest właśnie najbardziej efektywną metodą.

Policzenie kilku rzeczy mi jest potrzebne, gdyż wszystkie znaki, które są poza ISO 8859-2 są blokowane (exploit został spowolniony w wykonywaniu), więc byłbym niezmiernie wdzięczny, gdybym dostał informacje na podane w pierwszym akapicie pytania.
Pozdrawiam i miłego dnia,
Arek
komentarz 31 października 2019 przez DragonCoder Nałogowiec (36,500 p.)
1. Znak 8 bitow, 1 bajt

2. Ta koperta to chyba emoji, a emoji maja wlasny rozmiar, zalezny od jej wielkosci chyba itd.

3. http://ascii-table.com/keyboard.php/468-1

I sprawdz konwertujac sobie na binarke

2 odpowiedzi

0 głosów
odpowiedź 31 października 2019 przez tkz Nałogowiec (41,900 p.)
wybrane 2 listopada 2019 przez Iam
 
Najlepsza
Ogólnie ciężko na to pytanie odpowiedzieć. Najlepszą odpowiedzią było by "to zależy", tylko jest mało szczegółowa. A więc, teoretycznie od 8 bitów przy ASCII, idąc dalej masz utf-8, a tutaj to w praktyce ruletka. Zestawów znaków ze znakami niełacińskimi zakodowanymi w górnej połowie będą dwa razy większe. W przypadku niektórych skryptów, takich jak tajski i dewanagari znaki będą trzykrotnie większe. Istnieją nawet przykłady, w których pojedynczy bajt zamienia się w znak złożony w Unicode, a zatem jest sześciokrotnie większy w UTF-8. Spowodowało to sprzeciw w Indiach i innych krajach.
0 głosów
odpowiedź 31 października 2019 przez obl Maniak (51,120 p.)
  • 0x00 do 0x7F            – bity 0xxxxxxx, gdzie kolejne „x” to bity – licząc od najwyższego
  • 0x80 do 0x7FF           – bity 110xxxxx 10xxxxxx
  • 0x800 do 0xFFFF         – bity 1110xxxx 10xxxxxx 10xxxxxx
  • 0x10000 do 0x1FFFFF     – bity 11110xxx 10xxxxxx 10xxxxxx 10xxxxxx
  • 0x200000 do 0x3FFFFFF   – bity 111110xx 10xxxxxx 10xxxxxx 10xxxxxx 10xxxxxx
  • 0x4000000 do 0x7FFFFFFF – bity 1111110x 10xxxxxx 10xxxxxx 10xxxxxx 10xxxxxx 10xxxxxx

Nawet wikipedia odpowiada na takie pytania. Do zapisu znaków specjalnych wykorzystuje się najczęściej UTF-8 które ma konstrukcję jak powyżej. Polskie znaki specjalne mieszczą się w dwóch bajtach ale bardziej egzotyczne znaki już nie mają takiego szczęścia.

komentarz 31 października 2019 przez adrian17 Ekspert (322,460 p.)

kilka rzeczy związane z exploitem do gry Minecraft

W Javie, z tego co wiem, kodowanie stringów jest w UTF-16; więc zakładając że to Javowa wersja MC i że faktycznie używa zwykłych Javowych stringów, to jest jakaś szansa że to o to kodowanie chodzi.

Podobne pytania

0 głosów
1 odpowiedź 175 wizyt
pytanie zadane 3 czerwca 2016 w HTML i CSS przez uMAXa Gaduła (4,290 p.)
+2 głosów
12 odpowiedzi 403 wizyt
pytanie zadane 2 listopada 2015 w Offtop przez Sedi Stary wyjadacz (10,200 p.)
0 głosów
4 odpowiedzi 173 wizyt
pytanie zadane 3 grudnia 2020 w Offtop przez K4P3K Początkujący (360 p.)

88,720 zapytań

137,332 odpowiedzi

306,819 komentarzy

58,907 pasjonatów

Motyw:

Akcja Pajacyk

Pajacyk od wielu lat dożywia dzieci. Pomóż klikając w zielony brzuszek na stronie. Dziękujemy! ♡

Sklep oferujący ćwiczenia JavaScript, PHP, rozmowy rekrutacyjne dla programistów i inne materiały

Oto dwie polecane książki warte uwagi. Pełną listę znajdziesz tutaj.

...