Это ИТ-ресно. Двойные стандарты при определении единиц измерения количества информации
25 апреля 2012
Рубрика: ИТ-ресно.
Автор: .

Большинство из нас абсолютно уверены, что цифровые стандарты намного точнее, чем устаревшие аналоговые. Что килобайт он и в Африке килобайт и центральные процессоры вычисляют любое число с точностью до байта. А вместе с тем уже не одно десятилетие существует проблема с этими самыми Кило, Мега, Гига и Терабайтами. Как оказалось, у двоичной системы исчисления имеются две параллельно действующие системы определения единиц измерения количества информации.

Коммерческие ****байты или двоичные приставки?
Существует такой анекдот: «Обычный человек думает, что в килобайте 1000 байтов, а программист уверен, что в килограмме 1024 грамма».

Было бы смешно, если бы каждый раз маркетологи не вводили бы пользователей в заблуждение с реальным объемом устройств памяти. Одно дело купить, скажем, жесткий диск объемом 1 терабайт, думая, что это 1024 гигабайта. А другое дело узнать, что производитель считает, что в 1 терабайте всего 1000 Гбайт. Почему такая разница между «коммерческими» терабайтами и стандартными единицами измерения количества информации? Попробуем разобраться.

Корни проблемы
Двоичная система счисления имеет широчайшее применение в вычислительной технике. В частности, двоичными числами нумеруются ячейки цифровой памяти. Количество адресов, возможных на некоторой шине, равно, где N — количество ее разрядов. Поэтому и микросхемы памяти снабжают количеством ячеек, равным какой-то степени двойки.

Число 210 = 1024 достаточно близко к тысяче, используемой в качестве основания десятичных приставок СИ. Среди степеней двойки вплоть до 293 ни одна больше не близка настолько к степени десяти; к тому же показатель двоичной степени «10» сам по себе оказался удобен для грубого пересчета двоичных степеней на привычные людям десятичные числа. Для обозначения 210 = 1024 байт придумали единицу «К» (ка, очевидно, искаженное «кило»). В частности, в документации к одной из старых ЭВМ сказано, что объем ее памяти 32 К слов. Из-за близости множителей 1024 и 1000 в разговорной речи «К» все равно называли «кило», и вскоре такая интерпретация приставки кило стала стандартом де-факто, как и экстраполяция на другие приставки: 1 «килобайт» = 1024 байтам, 1 «мегабайт» = 1024 килобайтам = 1048576 байтам и т.д.

Таким образом, термины, предназначенные для десятичных приставок СИ, стали применяться к близким двоичным числам. Причем эти приставки часто используют по своему усмотрению, то есть одни понимают их как двоичные приставки, а другие как десятичные. Например, размер оперативной памяти компьютера обычно приводится в двоичных единицах (1 килобайт = 1024 байтам), а размер дисков их производители указывают в десятичных (1 килобайт = 1000 байтам). Однако на письме для множителя 1024 традиционно использовалось сокращение «К», в отличие от «к»=1000, используемого в СИ.

Чем больше число, тем большего значения может достигать ошибка, вызванная неправильным пониманием использованной приставки. В частности, разница между «двоичным» и «десятичным» килобайтом 2,4%, в то время как между двоичным и десятичным терабайтом — почти 10% (9,95%). Для того, чтобы разрешить эту путаницу, и были введены особые двоичные приставки, отличные от «близких» по численному значению десятичных.

Как должно быть. Двоичные приставки
Двоичные приставки — приставки перед единицами измерения, обозначающие их умножение на степени двойки (точнее, на степени числа 1024 = 210). Благодаря близости чисел 1024 и 1000 двоичные приставки построены по аналогии со стандартными десятичными приставками СИ. Каждая двоичная приставка получается заменой последнего слога соответствующей десятичной приставки на би (от лат. b+nrius — двоичный). Двоичные приставки используются для образования единиц измерения информации, кратных битам и байтам. Приставки были введены Международной электротехнической комиссией (МЭК) в марте 1999 года. Выглядят они следующим образом (таблица 1).

Стандарт был утвержден официально на международном уровне, но введенные названия практически не используются, по распространенному мнению, из-за их неблагозвучия: считается, что килобит звучит приятнее, нежели кибибит.

Международная электротехническая комиссия (МЭК; англ. International Electrotechnical Commission, IEC; фр. Commission ?lectrotechnique internationale, CEI)[1] — международная некоммерческая организация по стандартизации в области электрических, электронных и смежных технологий. Некоторые из стандартов МЭК разрабатываются совместно с Международной организацией по стандартизации (ISO).

МЭК составлена из представителей национальных служб стандартов. МЭК была основана в 1906 году и в настоящее время в ее состав входят более 76 стран. Первоначально комиссия располагалась в Лондоне, с 1948 года по настоящее время штаб-квартира находится в Женеве, Швейцария. В настоящее время имеет региональные центры в Юго-восточной Азии (Сингапур), Латинской Америке (Сан-Пауло, Бразилия) и Северной Америке (Бостон, США).

МЭК способствовала развитию и распространению стандартов для единиц измерения, особенно гаусса, герца, и вебера. Также МЭК предложила систему стандартов, которая в конечном счете стала единицами СИ.

Значение приставок согласно стандарту JEDEC
JEDEC — Joint Electron Device Engineering Council (Объединенный инженерный совет по электронным устройствам), занимающийся разработкой и продвижением стандартов для микроэлектронной промышленности. Стандарт памяти JEDEC 100B.01 распространяется на обозначение значений терминов и буквенных символов. Целью данного стандарта является содействие единообразному использованию символов, аббревиатур, терминов и определений в полупроводниковой промышленности. К примеру, спецификация стандарта, в качестве единицы измерения количества информации, определяет значение приставки K множителем, равным 1024 (210), то есть килобайт обязан быть обозначен как Kbyte или KB и иметь значение, равное 1024 байт.

Спецификация стандарта определяет приставки следующим образом:
kilo (K): как множитель, равный 1024 (210).
mega (M): как множитель, равный 1048576 (220 или K2, где коэффициент K = 1024).
giga (G): как множитель, равный 1073741824 (230 или K3, где коэффициент K = 1024).
tera (T): как множитель, равный 1099511627776 (240 или K4, где коэффициент K = 1024).

Двоичный подход
Приставки «кило-», «мега-», «гига-» понимаются как двоичные:
• В файловых менеджерах и другом программном обеспечении для сокращенного задания размера файлов. То есть, если программа говорит, что размер файла равен 100 «КБ» (KB), то его размер приблизительно равен 102400 байт. Однако в современных файловых менеджерах встречается правильное указание размера файлов (с использованием сокращенной формы производных двоичных приставок, например «КиБ»).
• Производителями оперативных запоминающих устройств (ОЗУ) и видеопамяти.
• Согласно ГОСТ 8.417-2002, приставку К- (заглавной буквой) применительно к байтам исторически некорректно использовали (и используют) для обозначения 1024 байт. Стандарт, однако, явно не указывает, какое написание единицы «1024 байт» следует считать корректным.

Основные аргументы: традиционное для компьютерной техники использование двоичных кратных, непроизносимость слов типа «гибибайт» или «Гбайт».

Десятичный подход
Приставки «кило-», «мега-», «гига-» понимаются как десятичные:
• Емкость жестких дисков, флэш-карт и оптических дисков задается именно в десятичных мегабайтах (исключение: компакт-диски, их объем задается в двоичных мегабайтах).
• При неформальном общении (например, про файл в 100 тысяч байт могут сказать «файл в 100 килобайт»).
• При обозначении скоростей телекоммуникационных соединений, например, 100 Мбит/с в стандарте 100BASE-TX («медный» Fast Ethernet) соответствует скорости передачи именно 100 000 000 бит/с, а 10 Гбит/с в стандарте 10GBASE-X (Ten Gigabit Ethernet) — 10 000 000 000 бит/с.

Основные аргументы: строгое соответствие системе СИ; повсеместное употребление десятичной системы счисления; завышение цифр объема носителей при помощи более мелкой единицы («коммерческие мегабайты»).

Применяемое в телекоммуникациях понятие «килобит» означает тысячу битов (по российскому ГОСТ 8.417-2002). Впрочем, из-за влияния «килобайта» некоторые люди и организации для однозначности употребляют вместо «килобита» выражение «тысяча бит».

А ****байт и ныне там…
Подводя итоги нашего небольшого исследования, можно лишь посочувствовать пользователям и рекомендовать тщательнее изучать реальный объем памяти приобретаемого устройства перед покупкой. Судя по тому, что двоичные приставки были введены Международной электротехнической комиссией (МЭК) в марте 1999 года и до настоящего времени их никто не использует реально, можно считать, что двойные стандарты при подсчете единиц измерения количества информации сохранятся еще долго.

Для написания данной статьи использовались материалы Свободной энциклопедии http://ru.wikipedia.org

Orphus system
Подписывайтесь на канал infoCOM.UZ в Telegram, чтобы первыми узнавать об ИКТ новостях Узбекистана
В Telegram
В Одноклассники
ВКонтакте