Yahoo собрала 13,5 ТБ данных о своих пользователях

В массиве данных, собранном специально для научных исследований, собрана информация о действиях пользователей на сервисах Yahoo. 20 млн человек, 110 млрд операций, 13,5 ТБ данных - компания проделала немалую работу, которая поможет усовершенствовать механизмы рекомендаций в интернете.

Yahoo переживает не лучшие времена, но ее сервисы продолжают работать. Миллионы людей по-прежнему заходят на сайт компании, чтобы почитать последние новости. На днях корпорация выпустила массив данных Yahoo News Feed dataset, в котором собрана анонимная информация об активности 20 миллионов пользователей. Данные собирались в период с февраля по март 2015 года на основе различных источников, в том числе стартовой страницы поисковика Yahoo, новостного сайта, а также Yahoo Спорт, Yahoo Финансы, Yahoo Кино и Yahoo Недвижимость.

Общий объем данных составил 13,5 ТБ. В нем зарегистрировано 110 миллиардов уникальных операций. По мнению компании, это самый крупный набор данных на основе машинного обучения, выпущенный когда-либо.

Yahoo выпустила эту подборку специально для ученых и исследователей, которые разрабатывают более эффективные алгоритмы рекомендаций в интернете. В данных представлена информация о заголовках статей, их кратком содержании и посещении тех или иных страниц (учитывают клики на статью). Также в базе есть анонимные демографические данные о 7 миллионах пользователей — возраст, пол, место проживания.

Усовершенствование механизмом рекомендаций в интернете с каждым годом становится все более необходимым. Сегодня многие сервисы полагаются на автоматизированные рекомендации и на их основе выбирают стратегию продвижения и генерирования контента.

Подписывайтесь
на наши каналы в Telegram

«Хайтек»новостионлайн

«Хайтек»Dailyновости 3 раза в день

Первая полоса
Тайны древней звезды по соседству изучили, «подслушав ее песню»
Космос
Baidu делает ИИ для перевода звуков животных в человеческую речь
Наука
Оказалось, ИИ врет чаще при одном условии: как этого избежать
Новости
Суперкомпьютер Маска сжирает электричество как 300 000 домов: люди протестуют
Новости
Посмотрите, как робот стремительно отбивает подачи в настольном теннисе
Новости
Физики исполнили мечту алхимиков: свинец в коллайдере превратили в золото
Наука
Создано музыкальное приложение для реабилитации после инсульта
Наука
«Эффект аккордеона» превращает жесткий графен в эластичный материал
Наука
ИИ восстановил имя автора свитка, который пережил последний день Помпеи
Наука
Частный лунный модуль вышел на орбиту спутника после двух месяцев полета
Космос
Предок тираннозавра «иммигрировал» в Америку из Азии, считают ученые
Наука
Обновленный Gemini 2.5 Pro от Google возглавил рейтинг ИИ для разработчиков
Новости
Ученые решили проблему, которая мешала запуску термоядерных реакторов почти 70 лет
Наука
Китайское «супероружие» для подводных диверсий оказалось не таким, как считалось
Новости
Отключение мобильного интернета в Москве: какие последствия для бизнеса
Новости
Киберполиция назвала новые схемы мошенников: как они воруют аккаунты на «Госуслугах»
Новости
Хокинг предсказал гибель Земли: оказалось, НАСА сочло угрозу реальной
Наука
Создатель Ethereum признал свои ошибки и решил изменить криптовалюту
Новости
«Ред ОС 8» заработала на Arm-платформах — теперь и на «Байкале»
Новости
Компания Цукерберга использовала уязвимость подростков для рекламы
Новости