• Najnowsze pytania
  • Bez odpowiedzi
  • Zadaj pytanie
  • Kategorie
  • Tagi
  • Zdobyte punkty
  • Ekipa ninja
  • IRC
  • FAQ
  • Regulamin
  • Książki warte uwagi

Pytanie odnośnie zajmowanej ilości bajtów przez znaki

Aruba Cloud - Virtual Private Server VPS
0 głosów
795 wizyt
pytanie zadane 31 października 2019 w Offtop przez Iam Nowicjusz (150 p.)
Dzień dobry wszystkim,
Mam pytanie następujące - ile bajtów informacji / w pamięci zajmuje mi napisanie zwykłej litery alfanumerycznej, ile taki znak "" (gdy kopiuję ten znak do gry to mam małe literki w środku kwadratu), a ile litera chińska/hinduska?

Informacje te są mi potrzebne, gdyż potrzebuję policzyć kilka rzeczy związane z exploitem do gry Minecraft, gdzie, żeby móc ten exploit zainicjować, potrzebuję w jednym chunku mieć jeden megabajt informacji, a zapisywanie wielu książek z tymi znakami jest właśnie najbardziej efektywną metodą.

Policzenie kilku rzeczy mi jest potrzebne, gdyż wszystkie znaki, które są poza ISO 8859-2 są blokowane (exploit został spowolniony w wykonywaniu), więc byłbym niezmiernie wdzięczny, gdybym dostał informacje na podane w pierwszym akapicie pytania.
Pozdrawiam i miłego dnia,
Arek
komentarz 31 października 2019 przez DragonCoder Nałogowiec (36,500 p.)
1. Znak 8 bitow, 1 bajt

2. Ta koperta to chyba emoji, a emoji maja wlasny rozmiar, zalezny od jej wielkosci chyba itd.

3. http://ascii-table.com/keyboard.php/468-1

I sprawdz konwertujac sobie na binarke

2 odpowiedzi

0 głosów
odpowiedź 31 października 2019 przez tkz Nałogowiec (42,020 p.)
wybrane 2 listopada 2019 przez Iam
 
Najlepsza
Ogólnie ciężko na to pytanie odpowiedzieć. Najlepszą odpowiedzią było by "to zależy", tylko jest mało szczegółowa. A więc, teoretycznie od 8 bitów przy ASCII, idąc dalej masz utf-8, a tutaj to w praktyce ruletka. Zestawów znaków ze znakami niełacińskimi zakodowanymi w górnej połowie będą dwa razy większe. W przypadku niektórych skryptów, takich jak tajski i dewanagari znaki będą trzykrotnie większe. Istnieją nawet przykłady, w których pojedynczy bajt zamienia się w znak złożony w Unicode, a zatem jest sześciokrotnie większy w UTF-8. Spowodowało to sprzeciw w Indiach i innych krajach.
0 głosów
odpowiedź 31 października 2019 przez obl Maniak (51,300 p.)
  • 0x00 do 0x7F            – bity 0xxxxxxx, gdzie kolejne „x” to bity – licząc od najwyższego
  • 0x80 do 0x7FF           – bity 110xxxxx 10xxxxxx
  • 0x800 do 0xFFFF         – bity 1110xxxx 10xxxxxx 10xxxxxx
  • 0x10000 do 0x1FFFFF     – bity 11110xxx 10xxxxxx 10xxxxxx 10xxxxxx
  • 0x200000 do 0x3FFFFFF   – bity 111110xx 10xxxxxx 10xxxxxx 10xxxxxx 10xxxxxx
  • 0x4000000 do 0x7FFFFFFF – bity 1111110x 10xxxxxx 10xxxxxx 10xxxxxx 10xxxxxx 10xxxxxx

Nawet wikipedia odpowiada na takie pytania. Do zapisu znaków specjalnych wykorzystuje się najczęściej UTF-8 które ma konstrukcję jak powyżej. Polskie znaki specjalne mieszczą się w dwóch bajtach ale bardziej egzotyczne znaki już nie mają takiego szczęścia.

komentarz 31 października 2019 przez adrian17 Mentor (352,580 p.)

kilka rzeczy związane z exploitem do gry Minecraft

W Javie, z tego co wiem, kodowanie stringów jest w UTF-16; więc zakładając że to Javowa wersja MC i że faktycznie używa zwykłych Javowych stringów, to jest jakaś szansa że to o to kodowanie chodzi.

Podobne pytania

0 głosów
0 odpowiedzi 101 wizyt
pytanie zadane 2 września 2024 w Offtop przez distracted Użytkownik (540 p.)
–1 głos
1 odpowiedź 210 wizyt
+2 głosów
2 odpowiedzi 293 wizyt

93,334 zapytań

142,328 odpowiedzi

322,406 komentarzy

62,670 pasjonatów

Motyw:

Akcja Pajacyk

Pajacyk od wielu lat dożywia dzieci. Pomóż klikając w zielony brzuszek na stronie. Dziękujemy! ♡

Oto polecana książka warta uwagi.
Pełną listę książek znajdziesz tutaj

Wprowadzenie do ITsec, tom 1 Wprowadzenie do ITsec, tom 2

Można już zamawiać dwa tomy książek o ITsec pt. "Wprowadzenie do bezpieczeństwa IT" - mamy dla Was kod: pasja (użyjcie go w koszyku), dzięki któremu uzyskamy aż 15% zniżki! Dziękujemy ekipie Sekuraka za fajny rabat dla naszej Społeczności!

...