• Najnowsze pytania
  • Bez odpowiedzi
  • Zadaj pytanie
  • Kategorie
  • Tagi
  • Zdobyte punkty
  • Ekipa ninja
  • IRC
  • FAQ
  • Regulamin
  • Książki warte uwagi

Pytanie odnośnie zajmowanej ilości bajtów przez znaki

Object Storage Arubacloud
0 głosów
427 wizyt
pytanie zadane 31 października 2019 w Offtop przez Iam Nowicjusz (150 p.)
Dzień dobry wszystkim,
Mam pytanie następujące - ile bajtów informacji / w pamięci zajmuje mi napisanie zwykłej litery alfanumerycznej, ile taki znak "" (gdy kopiuję ten znak do gry to mam małe literki w środku kwadratu), a ile litera chińska/hinduska?

Informacje te są mi potrzebne, gdyż potrzebuję policzyć kilka rzeczy związane z exploitem do gry Minecraft, gdzie, żeby móc ten exploit zainicjować, potrzebuję w jednym chunku mieć jeden megabajt informacji, a zapisywanie wielu książek z tymi znakami jest właśnie najbardziej efektywną metodą.

Policzenie kilku rzeczy mi jest potrzebne, gdyż wszystkie znaki, które są poza ISO 8859-2 są blokowane (exploit został spowolniony w wykonywaniu), więc byłbym niezmiernie wdzięczny, gdybym dostał informacje na podane w pierwszym akapicie pytania.
Pozdrawiam i miłego dnia,
Arek
komentarz 31 października 2019 przez DragonCoder Nałogowiec (36,500 p.)
1. Znak 8 bitow, 1 bajt

2. Ta koperta to chyba emoji, a emoji maja wlasny rozmiar, zalezny od jej wielkosci chyba itd.

3. http://ascii-table.com/keyboard.php/468-1

I sprawdz konwertujac sobie na binarke

2 odpowiedzi

0 głosów
odpowiedź 31 października 2019 przez tkz Nałogowiec (42,000 p.)
wybrane 2 listopada 2019 przez Iam
 
Najlepsza
Ogólnie ciężko na to pytanie odpowiedzieć. Najlepszą odpowiedzią było by "to zależy", tylko jest mało szczegółowa. A więc, teoretycznie od 8 bitów przy ASCII, idąc dalej masz utf-8, a tutaj to w praktyce ruletka. Zestawów znaków ze znakami niełacińskimi zakodowanymi w górnej połowie będą dwa razy większe. W przypadku niektórych skryptów, takich jak tajski i dewanagari znaki będą trzykrotnie większe. Istnieją nawet przykłady, w których pojedynczy bajt zamienia się w znak złożony w Unicode, a zatem jest sześciokrotnie większy w UTF-8. Spowodowało to sprzeciw w Indiach i innych krajach.
0 głosów
odpowiedź 31 października 2019 przez obl Maniak (51,280 p.)
  • 0x00 do 0x7F            – bity 0xxxxxxx, gdzie kolejne „x” to bity – licząc od najwyższego
  • 0x80 do 0x7FF           – bity 110xxxxx 10xxxxxx
  • 0x800 do 0xFFFF         – bity 1110xxxx 10xxxxxx 10xxxxxx
  • 0x10000 do 0x1FFFFF     – bity 11110xxx 10xxxxxx 10xxxxxx 10xxxxxx
  • 0x200000 do 0x3FFFFFF   – bity 111110xx 10xxxxxx 10xxxxxx 10xxxxxx 10xxxxxx
  • 0x4000000 do 0x7FFFFFFF – bity 1111110x 10xxxxxx 10xxxxxx 10xxxxxx 10xxxxxx 10xxxxxx

Nawet wikipedia odpowiada na takie pytania. Do zapisu znaków specjalnych wykorzystuje się najczęściej UTF-8 które ma konstrukcję jak powyżej. Polskie znaki specjalne mieszczą się w dwóch bajtach ale bardziej egzotyczne znaki już nie mają takiego szczęścia.

komentarz 31 października 2019 przez adrian17 Ekspert (344,860 p.)

kilka rzeczy związane z exploitem do gry Minecraft

W Javie, z tego co wiem, kodowanie stringów jest w UTF-16; więc zakładając że to Javowa wersja MC i że faktycznie używa zwykłych Javowych stringów, to jest jakaś szansa że to o to kodowanie chodzi.

Podobne pytania

+2 głosów
2 odpowiedzi 133 wizyt
0 głosów
1 odpowiedź 240 wizyt
pytanie zadane 3 czerwca 2016 w HTML i CSS przez uMAXa Gaduła (4,290 p.)
+2 głosów
12 odpowiedzi 548 wizyt
pytanie zadane 2 listopada 2015 w Offtop przez Sedi Stary wyjadacz (10,200 p.)

92,555 zapytań

141,403 odpowiedzi

319,554 komentarzy

61,939 pasjonatów

Motyw:

Akcja Pajacyk

Pajacyk od wielu lat dożywia dzieci. Pomóż klikając w zielony brzuszek na stronie. Dziękujemy! ♡

Oto polecana książka warta uwagi.
Pełną listę książek znajdziesz tutaj.

Akademia Sekuraka

Kolejna edycja największej imprezy hakerskiej w Polsce, czyli Mega Sekurak Hacking Party odbędzie się już 20 maja 2024r. Z tej okazji mamy dla Was kod: pasjamshp - jeżeli wpiszecie go w koszyku, to wówczas otrzymacie 40% zniżki na bilet w wersji standard!

Więcej informacji na temat imprezy znajdziecie tutaj. Dziękujemy ekipie Sekuraka za taką fajną zniżkę dla wszystkich Pasjonatów!

Akademia Sekuraka

Niedawno wystartował dodruk tej świetnej, rozchwytywanej książki (około 940 stron). Mamy dla Was kod: pasja (wpiszcie go w koszyku), dzięki któremu otrzymujemy 10% zniżki - dziękujemy zaprzyjaźnionej ekipie Sekuraka za taki bonus dla Pasjonatów! Książka to pierwszy tom z serii o ITsec, który łagodnie wprowadzi w świat bezpieczeństwa IT każdą osobę - warto, polecamy!

...