Кейсы 12 августа 2020

Сколько весит интернет? Рассказываем, как данные растут в объеме

Далее

Вопросом о том, сколько весит интернет, интересовал многих исследователей. Группы ученых использовали разные подходы для того, чтобы подсчитать количество письменной, аудиальной и визуальной информации. В это и упиралась главная сложность: нужно было найти общее «мерило» для всех видов контента, а также помножить это на ежедневную тенденцию к расширению глобальной сети. Мы собрали главное о том, сколько месте занимает интернет и куда нас приведет его бурный рост.

Были ли исследования на эту тему?

Рассчитать массу интернета можно несколькими путями, по крайне мере ученые расходятся в способах.

Первый метод расчета массы Сети, предложенный Расселом Сейтцем, использует данные о количестве серверов, поддерживающих ее работу (от 75 до 100 млн по разным данным), об их среднем энергопотреблении (от 350 до 550 Вт), среднем напряжении в их логических схемах (3 В) и тактовой частоты (1 ГГц).

Силу тока в 1 Ампер создает поток из примерно 1 018 электронов в секунду. Прямой расчет показывает, что работа интернета в целом обеспечивается движением чуть более 50 грамм электронов.

Рассел Сейтц, ведущий исследователь 

Другой точки зрения придерживались сотрудники американского научно-популярного журнала Discovery. 

Вот как рассуждали они: длиннейшая цепочка единиц и нулей, в которой зашифрован передаваемый документ, для путешествия по сети разбивается на пакеты размером от нескольких десятков до нескольких сотен байт. К каждому пакету цепляется еще и адрес, куда его слать, и номер, позволяющий на месте получения правильно собрать пакеты в единое целое. По дороге эти пакеты проходят через множество компьютеров, и в каждом они ненадолго задерживаются в памяти и анализируются. Затем определяется их дальнейший путь, и они пересылаются дальше.

Оба расчета исходят из массы покоя электронов (9,1*10−31 кг). По словам того же Рассела Сейтца, для «подпитывания» потока 50 грамм электронов приходится прилагать около 50 млн лошадиных сил. 

Как рассчитывать массу?

Если эту небольшую статью послать по электронной почте, она займет около 25 КБ (только текст, без картинки). В килобайте 1 024 байт, в байте — 8 бит. Следовательно, объем статьи в битах — 205 000. Можно считать, что из них половина единицы, половина — нули. Значит, единиц 102 500, и каждая изображается 40 тысячами электронов. В целом на запись этой статьи пошло примерно 4 млрд электронов. Масса электрона 9,11.10 28 грамма, умножьте — и вы получите массу данного текста в памяти компьютера.

Но это только одно электронное письмо. По данным за 2008 год, вся пересылаемая информация за день весила 0,0057 миллиграмма. И еще треть от этого веса надо добавить, если мы хотим учесть не только обмен файлами между пользователями, но и информацию, запрашиваемую у сайтов.

Как активность изменилась сегодня?

Согласно сервису Internet Live Stats, каждую секунду в Google делается более 50 000 поисковых запросов, просматривается 120 000 видео на YouTube, отправляется почти 2,5 млн электронных писем. Да, весьма впечатляет, но всё же эти данные не позволяют в полной мере представить себе размеры интернета.

В сентябре 2014 года общее количество сайтов перевалило за миллиард, и сегодня их примерно 1,018 млрд. А ведь здесь еще не подсчитана так называемая «глубокая паутина», то есть совокупность сайтов, не индексируемых поисковиками: контент там может быть как совершенно безобидным (например, онлайновые базы данных), так и совершенно незаконным (к примеру, торговые площадки черного рынка с доступом только через Tor). Хотя браузером Tor пользуются не только нарушители, но и пользователи, которые хотят анонимности. 

Отметим, что вышеприведенная оценка численности веб-сайтов является приблизительной. Сайты возникают и исчезают, к тому же размеры глубокой и темной паутин определить практически невозможно. Поэтому даже приблизительно оценивать размеры сети по этому критерию весьма непросто. Но одно несомненно — сеть постоянно растет.

Одним из способов оценки циркулирующей в интернете информации является измерение трафика. Согласно данным Cisco, к концу 2016 года по всему миру будет передано 1,1 зеттабайта данных. А в 2019 году объем трафика удвоился достигнув 2 зеттабайт в год. 

Но как можно попытаться представить себе 1021 байт? Один зеттабайт эквивалентен 36 000 лет HDTV-видео. И понадобится 5 лет для просмотра видео, передаваемого по миру каждую секунду. 

Как эта информация представлена на физических носителях?

Несмотря на восход цифрового века, для многих из нас биты и байты остаются понятиями несколько абстрактными. Раньше память измеряли мегабайтами, теперь гигабайтами. А что, если попробовать представить размер интернета в каком-то вещественном воплощении?

В 2015 году двое ученых предложили использовать для оценки настоящие бумажные страницы А4. Взяв за основу данные с вышеупомянутого сервиса WorldWideWebSize, они решили считать каждую веб-страницу эквивалентной 30 страницам бумажным. Получили 4,54 х 109 х 30 = 1,36 х 1011 страниц А4.

Но с точки зрения человеческого восприятия это ничем не лучше тех же байтов. Поэтому бумагу привязали к амазонским джунглям. Согласно расчету авторов, для изготовления вышеуказанного количества бумаги нужно 8 011 765 деревьев, что эквивалентно 113 км2 джунглей, то есть 0,002% от общей площади амазонских зарослей.

Хотя позднее в газете Washington Post предположили, что 30 страниц — слишком много, и одну веб-страницу правильнее приравнять к 6,5 страницам А4. Тогда весь интернет можно распечатать на 305,5 млрд бумажных листов.

Но всё это справедливо лишь для текстовой информации, которая занимает далеко не самую большую долю от общего объема данных. Согласно Cisco, в 2015 году на одно только видео приходилось 27 500 ПБ в месяц, а совокупный трафик веб-сайтов, электронной почты и «данных» — 7 700 ПБ.

Немногим меньше пришлось на передачу файлов — 6 100 ПБ. Если кто забыл, петабайт равен миллиону гигабайт. Так что амазонские джунгли никак не позволят представить объемы данных в интернете.

В упомянутом выше исследовании от 2011 года предлагалось визуализировать с помощью компакт-дисков. Как утверждают авторы, в 2007 году 94% все информации было представлено в цифровом виде — 277,3 оптимально сжатых эксабайта (термин, обозначающий сжатие данных с помощью наиболее эффективных алгоритмов, доступных в 2007 году).

Если записать всё это богатство на DVD (по 4,7 Гб), то получим 59 000 000 000 болванок. Если считать толщину одного диска равной 1,2 мм, то эта стопка будет высотой 70 800 км.

Для сравнения, длина экватора равна 40 000 км, а общая протяженность государственной границы России — 61 000 км. Причем это объем данных по состоянию на 2007 год. Теперь попробуем таким же образом оценить общий объём трафика, который прогнозируется на этот год — 1,1 зеттабайта. Получим стопку DVD-дисков высотой 280 850 км. Тут уже впору переходить на космические сравнения: среднее расстояние до Луны составляет 385 000 км.

Как изменится объем информации: прогнозы ученых

Сотрудник Портсмутского университета Мелвин Вопсон подсчитал, что цифровая информация может составить половину массы Земли уже к 2245 году при нынешних темпах ее увеличения. Свою статью ученый опубликовал в журнале AIP Advances. 

Вопсон основывается на принципе эквивалентности массы и энергии в общей теории относительности Эйнштейна, а также на работе Рольфа Ландауэра, который применил законы термодинамики к информации, и на исследовании Клода Шеннона, который изобрел бит. 

Согласно Вопсону, примерно через 130 лет энергия, необходимая для поддержания процесса создания цифровой информации, сравняется со всей энергией, производимой в настоящее время на планете Земля, и к 2245 году половина массы Земли будет преобразована в «массу цифровой информации».

Ученый сделал такой вывод, поскольку человечество использует такие ресурсы, как уголь, нефть, природный газ, медь, кремний и алюминий для создания и поддержания работы огромных компьютерных ферм и обработки цифровой информации, это ведет к перераспределению земной материи от физических атомов к цифровой информации — пятому состоянию материи наряду с жидкостью, твердым телом, газом и плазмой.

В конце концов, согласно автору новой работы, мы достигнем состояния, когда количество битов, созданных человеком, превзойдет количество атомов на Земле. Согласно расчетам Вопсона, это произойдет уже через 150 лет, учитывая нынешние темпы прироста количества информации по 50% в год.

Рост количества цифровой информации кажется неудержимым. По данным IBM и других компаний, занимающихся исследованием больших данных, 90% мировой информации, существующей сегодня, было создано только за последние 10 лет. В некотором смысле нынешняя пандемия COVID-19 ускорила этот процесс, поскольку благодаря ей мы начали производить и использовать больше цифрового контента, чем когда-либо прежде. 

Мелвин Вопсон, сотрудник Портсмутского университета 

Физик заявил, что через 130 лет энергия, необходимая для поддержания процесса создания цифровой информации, сравняется со всей энергией, которая производится сейчас на Земле. Ученый также отметил, что 90% мировой информации, существующей сегодня, было создано за последние десять лет.

Читать также

Искатель сокровищ нашел клад в Шотландии, которому 3000 лет

Метеорный поток Персеиды — 2020: где его увидеть, куда смотреть и как сделать фото

Ученые разработали первый алгоритм для понимания квантового шума