Yahoo собрала 13,5 ТБ данных о своих пользователях

В массиве данных, собранном специально для научных исследований, собрана информация о действиях пользователей на сервисах Yahoo. 20 млн человек, 110 млрд операций, 13,5 ТБ данных - компания проделала немалую работу, которая поможет усовершенствовать механизмы рекомендаций в интернете.

Yahoo переживает не лучшие времена, но ее сервисы продолжают работать. Миллионы людей по-прежнему заходят на сайт компании, чтобы почитать последние новости. На днях корпорация выпустила массив данных Yahoo News Feed dataset, в котором собрана анонимная информация об активности 20 миллионов пользователей. Данные собирались в период с февраля по март 2015 года на основе различных источников, в том числе стартовой страницы поисковика Yahoo, новостного сайта, а также Yahoo Спорт, Yahoo Финансы, Yahoo Кино и Yahoo Недвижимость.

Общий объем данных составил 13,5 ТБ. В нем зарегистрировано 110 миллиардов уникальных операций. По мнению компании, это самый крупный набор данных на основе машинного обучения, выпущенный когда-либо.

Yahoo выпустила эту подборку специально для ученых и исследователей, которые разрабатывают более эффективные алгоритмы рекомендаций в интернете. В данных представлена информация о заголовках статей, их кратком содержании и посещении тех или иных страниц (учитывают клики на статью). Также в базе есть анонимные демографические данные о 7 миллионах пользователей — возраст, пол, место проживания.

Усовершенствование механизмом рекомендаций в интернете с каждым годом становится все более необходимым. Сегодня многие сервисы полагаются на автоматизированные рекомендации и на их основе выбирают стратегию продвижения и генерирования контента.

Подписывайтесь
на наши каналы в Telegram

«Хайтек»новостионлайн

«Хайтек»Dailyновости 3 раза в день

Первая полоса
Ученые предостерегают от создания зеркальных бактерий: они угрожают жизни
Наука
Астрономы наблюдали редкий гамма-всплеск от черной дыры в соседней галактики
Космос
Физики нашли странную частицу: ее масса то возникает, то исчезает
Наука
Генетики выяснили, когда неандертальцы скрещивались с современными людьми
Наука
В Google оценили риски для криптографии с появлением квантового чипа Willow
Новости
На звездах, подобных Солнцу, супервспышки происходят чаще, чем считалось
Космос
Google Play закрывает монетизацию для разработчиков из России
Новости
НАСА установило причины «первой авиакатастрофы на Марсе»
Космос
Университетский стартап из Грозного разработал VR-тренажер для хоккеистов
Новости
Микророботы из гидрогеля уменьшили раковые опухоли у мышей
Наука
Форум по робототехнике для школьников и студентов пройдет в Иннополисе
Иннополис
В пещере «первых Homo sapience Евразии» обнаружили ритуальную комнату
Наука
Эксперты обсудили путь от замещения импорта к технологическому лидерству
Наука
В ранней Вселенной нашли галактику, напоминающую юный Млечный Путь
Космос
Материал с МКС лучше земных аналогов активирует восстановление костей
Космос
Болото вместо степи: выяснили, каким был мост между Евразией и Америкой
Наука
Горбатый кит в поисках партнера пересек три океана и проплыл 13 000 км
Наука
Химики создали суперустойчивые кишечные палочки для промышленности
Наука
В IBM придумали как в пять раз быстрее обучать ИИ и экономить энергию
Новости
«Т-Технологии» бесплатно предоставит разработчикам российские модели ИИ
Новости