Более 2 млн самых старых постов в интернете выложили в открытый доступ

Разработчик-программист из Канады Джозеф Ярощак объявил, что публикует в открытом доступе огромный архив записей на Usenet — старейшей дискуссионной площадке интернета. Она возникла еще в 1980 году, задолго до того, как сложилось устройство Сети в ее современном виде, и действует до сих пор, сообщает Vice.

За десятилетия до тредов Twitter, форумов Reddit или групп в Facebook существовал Usenet: ранняя интернет-система дискуссий, где можно было начинать и присоединяться к обсуждениям, так же, как и сегодня работают посты с комментариями. Запущенный в 1980 году, Usenet — это детище двух студентов Университета Дьюка, которые хотели общаться между децентрализованными локальными серверами — и этот проект действует до сих пор.

В Usenet люди говорят обо всем, от нанотехнологий до мыльных опер, вина и НЛО. Йозеф Ярощак, системный архитектор из Онтарио, впервые познакомился с Usenet в 2000 году, когда нашел постоянную работу в Канаде благодаря размещению там вакансии.

На этой неделе Ярощак загрузил некоторые из старейших сообщений Usenet, доступных в интернете. Около 2,1 миллиона сообщений из архива UTZOO NetNews Генри Спенсера за период с февраля 1981 г. по июнь 1991 г. собраны в архиве Usenet и доступны любому желающему.

Сайт Usenet Archive — это часть другого, куда более масштабного проекта, который запустил Джозеф Ярощак. Он используется также для хранения постов современных независимых интернет-проектов, не связанных с корпорациями наподобие Google. Потенциально он может хранить порядка миллиарда записей. В настоящее время он архивирует 317 миллионов сообщений в 10 000 уникальных групп новостей Usenet — и, по оценкам Ярощака, в конечном итоге в нем будет храниться около 1 миллиарда сообщений.

Беседа о литературе киберпанка, 1987 год

© usenetarchives.com

Генри Спенсер из Университета Торонто, факультет зоологии, хранил архивы групп на 141 магнитной ленте. «Ленты UTZOO-Wiseman Usenet — это, по сути, самые ранние доступные обсуждения, размещенные в интернете людьми, работающими в различных университетах, которые уже были подключены к интернету», — объяснил Ярощак в интервью для Vice.

Спенсеру и нескольким коллегам удалось перенести данные с магнитной ленты в формат .TAR (Tape ARchive), и Ярощак, который много лет работал архиватором Usenet, преобразовал эти ленты в базу данных PostgreSQL с возможностью поиска, которую он затем загрузил в архивы Usenet. Попутно, помимо парсеров для архива магнитных лент Utzoo, он создал конвертеры на PHP, JavaScript, Java и Python и сделал их доступными на Github в качестве ресурсов с открытым исходным кодом, которые мог использовать любой.

Из групп Utzoo он загрузил почти 26 300 000 сообщений и их количество продолжает расти.

«Эта сокровищница старых постов должна быть доступна будущим поколениям», — заключает Ярощак. «Эти сотни миллионов сообщений может быть интересно читать, но, что более важно, они проливают свет на мыслительный процесс интернет-сообщества на ранних этапах самого интернета. Это огромное количество важного исторического и исследовательского контента. Было бы пренебрежением с моей стороны и со стороны других архивистов, упустить возможность вернуть эти старые текстовые группы Usenet из архивов в открытый доступ».

Читать также

В черных дырах могут быть вселенные. Рассказываем о новом открытии

На 3 день болезни большинство больных COVID-19 теряют обоняние и часто страдают насморком

Ученые выяснили, почему дети являются самыми опасными переносчиками COVID-19

Подписывайтесь
на наши каналы в Telegram

«Хайтек»новостионлайн

«Хайтек»Dailyновости 3 раза в день

Первая полоса
Ученые создают датчики, похожие на усики комаров, для обнаружения землетрясений
Наука
ИИ диагностирует диабет, ВИЧ и COVID по одному образцу крови
Наука
Китайские генетики создали «рис для укрепления здоровья сердечной системы»
Наука
Тяжелое генетическое заболевание вылечили до рождения в утробе матери
Наука
Высокоскоростная съемка показала, что происходит с каплей при падении в бассейн
Наука
В России создали ИИ-платформу для ускоренной разработки лекарств
Иннополис
Физики побили рекорд Китая по удержанию плазмы в искусственном Солнце
Наука
Мертвая галактика посылает мощные радиовсплески: ученые не могут это объяснить  
Космос
«Невозможная» пара звезд-вампиров странно ведет себя в космосе
Космос
В iPhone 16e стоят чипы, которые оказались недостаточно хороши для iPhone 16
Новости
Выяснилось, как темная тема на сайтах влияет на гаджеты
Новости
Ученые впервые создали «пластичный» инопланетный лед
Наука
В каких странах больше боятся замены людей на ИИ, показало исследование
Наука
Мини-землетрясения под ледяным щитом Гренландии могут изменить уровень моря
Наука
Посмотрите, как Blue Ghost летит над обратной стороной Луны
Космос
Польский стартап представил робота с искусственными мышцами и костями
Новости
Ископаемые находки меняют представление об эволюции неандертальцев
Наука
Microsoft представила квантовый чип Majorana 1 «из новой формы материи»
Новости
Посмотрите на огненный дождь в небе: фрагменты ракеты SpaceX упали в Европе
Космос
Жители России смогут наблюдать редкое астрономическое явление в феврале
Космос