Сколько байт весит один символ
Перейти к содержимому

Сколько байт весит один символ

  • автор:

Почему для кодирования одного символа нужен именно 1 байт?

Почему для кодирования 1-го символа нужен именно 1 байт? Я прекрасно понимаю, что минимальная единица информации — 1 бит и чтобы выразить 255 символов в двоичном коде надо использовать 8 бит. И по таблице брать двоичный код и по нему находить нужный символ, но почему каждый символ обязательно занимает 1 байт? Зачем записывать число именно вот так 0000001 , а не просто 1 , тем самым заняв всего 1 бит информации и по таблице взять ему соответствующий символ.

Отслеживать
51.6k 204 204 золотых знака 67 67 серебряных знаков 251 251 бронзовый знак
задан 1 авг 2018 в 17:23
Никита Антонов Никита Антонов
125 1 1 серебряный знак 9 9 бронзовых знаков

Байт — минимальная адресуемая единица информации. Хранить каждый символ меньше чем в одном байте неэффективно по скорости доступа. А для длительного хранения (при сохранении в файл, например) никто не мешает применить сжатие.

1 авг 2018 в 17:27
@insolor, Use the answer form, Luke!
– user207618
1 авг 2018 в 17:34
Символы не хранят в одном байте уже лет тридцать 🙂
1 авг 2018 в 17:36

А вообще теоретически использовать один бит не разрешает, только вот 11111111 — это один символ (число 255) или восемь символов 1 ? Придётся добавлять дополнительную информацию, поясняющую, как правильно интерпретировать эти единицы. Ну и да, использовать число битов меньшее чем «минимальная адресуемая единица информации» банально неудобно, ибо именно под восьмибитный байт спроектированы все современные компьютеры

1 авг 2018 в 17:39

@andreymal, о спасибо большое! Теперь дошло! Только вот еще вопрос тоесть большие последовательности в зависимости от кодировки делятся на определенное количество байт (1, 2 и тд) и уже по таблице находится определенные символы ?

1 авг 2018 в 17:42

1 ответ 1

Сортировка: Сброс на вариант по умолчанию

Не обязательно 1 ..есть кодировки (например utf-16, utf-32 ) где символы по 2 , по 4 байта. тут еще многое зависит от количества кодируемых символов. не всегда хватает 256 вариантов. часто нужно больше.то есть битность напрямую зависит от числа символов в таблице символов. Если влезть в ассемблер, то можно сделать свою таблицу символов. проблема будет только в том что твою кодировку будет понимать только твоя программа. А так просто принятый стандарт, и все. по поводу же адресации, да — опять же стандарт. хотя есть системы , которые работают и 9-ю битами ( старые советские системы связи) , где 9-й бит был или контрольным или знак передавал.

Отслеживать
ответ дан 1 авг 2018 в 17:35
Сергей Петрашко Сергей Петрашко
1,493 8 8 серебряных знаков 15 15 бронзовых знаков

Я наверное неправильно задал вопрос имею в виду почему все символы имеют 1 и тот же размер(тоесть 2 байта или 1), а не так чтобы 1 символ весит больше, а другой меньше, если все равно старшие разряды заполнены нулями (00000001 к примеру)

1 авг 2018 в 17:38

@НикитаАнтонов в кодировке UTF-8 длина одного символа может быть 1, 2, 3 или 4 байта 🙂 А использовать число бит, не кратное восьми, неудобно из-за архитектуры современных компьютеров, заточенных именно на 8 бит

1 авг 2018 в 17:40

будут проблемы с синхронизацией. такая проблема есть в азбуке морзе. то есть трудно понять где закончился один символ и начался второй. поэтому и принято использовать такие битности.

Сколько весит один символ?

в зависимости от того, где этот символ расположен.
В текстовом документе от 1 до 2 байт (в зависимости от версии блокнота) , В ворде до нескольких байт. А ещё символ можно нарисовать в картинке, тогда до нескольких килобайт 🙂
А вообще вопрос составлен некорректно.

Меньше одного грамма!
Смотря в какой кодировке. Если допустим в «Windows-1251», то 1 байт. Если в Unicode, то 2 или 4 😉

Так. Тут надо размышлять разумно! Одна цифра в Юникоде весит 4 Байта! А Буква или например (#$@!&)←Эти символы весят 3 Байта! Так что некоторые моменты ошибочны!

цифра 1 бит
буква 8 бит или 1 байт
11 кг
примерно это весовая величина! арроба или что типо того

Символы имеют разные размеры и веса, и вопрос о том, какой символ весит больше всего, не имеет однозначного ответа без уточнения, каким именно способом вы хотите измерять вес символа.

Если речь идет о размере символа в памяти компьютера, то размер символа зависит от используемой кодировки. Например, в ASCII каждый символ занимает 1 байт, а в Unicode, особенно в UTF-8, размер символа может быть различным (от 1 до 4 байт).

Если вы имеете в виду визуальный вес символа, то это зависит от выбранного шрифта и его настроек. В разных шрифтах и стилях символы могут иметь разные визуальные веса (например, тонкий, обычный, полужирный, жирный).

Если вы имеете в виду вес символа с точки зрения ширины, то также это будет зависеть от выбранного шрифта и его метрик. Некоторые символы могут быть шире или уже других символов.

Таким образом, чтобы точно определить, какой символ «весит» больше всего, необходимо уточнить контекст и метод измерения веса символа.

Один символ в кодировке UTF-16 занимает (в Википедию и Гугл не подсматривать!):

Только зарегистрированные пользователи могут участвовать в опросе. Войдите, пожалуйста.

Один символ в кодировке UTF-16 занимает (в Википедию и Гугл не подсматривать!):

2.55% 1 байт 253

31.41% 2 байта 3117

20.56% 4 байта 2040

7.57% 1-4 байта 751

12.04% 2-4 байта 1195

12.67% 16 байт 1257

8.12% от 2 байт до бесконечности 806

5.09% верного ответа выше нет 505

Проголосовали 9924 пользователя. Воздержались 1490 пользователей.

Всего голосов 127: ↑87 и ↓40 +47

Добавить в закладки 14

Подписаться

Отправить сообщение

Публикации

Лучшие за сутки Похожие

Объём памяти текстовой информации

В компьютере все символы представляются в виде кода из 0 и 1. Для работы с кодированием цифр, букв и других символов, таких как знаки препинания, пробелы, арифметические операции и т.д. были придуманы таблицы кодировок.

Количество символов необходимое нам для набора текста, состоящего из этих специальных символов, цифр и букв английского алфавита было закодировано с помощью таблицы ASCII (American Standard Code for Information Interchange). В этом наборе вес одного символа имеет 7 бит (2 7 — ближайшая максимальная степень двойки). Но в рамках этой таблицы создание многоязычных документов оказалось очень проблематичным. Эту кодировку пытались расширять, и это получалось, но программное обеспечение должно было следить за кодовыми страницами, и смешивать языки оказалось невозможным.

Позже появилась еще одна кодировка Unicode, которая позволяла закодировать 1 114 112 символов. Стандарт Unicode поддерживается тремя формами:

Добавить комментарий

Ваш адрес email не будет опубликован. Обязательные поля помечены *