Сообщить об ошибке на сайте
URL
Ошибка
Идеи

Аспирант Вэньлэй Се разработал алгоритм для поисковых систем, благодаря которому реакция на действия пользователя в сети происходит незамедлительно, в реальном времени. Технология может найти применение в социальных сетях, базах данных, рекомендательных системах и поисковых машинах.

Компьютеры научились запоминать наши запросы и предлагать нам то, чем мы интересовались на днях. «Если ты покупаешь что-то на Amazon сегодня, то завтра он покажет тебе нечто похожее», — объясняет Се. Но этот алгоритм работает не мгновенно. В отличие от алгоритма Се и его коллег из Университета Тиш.

Историю поиска в сети можно представить в виде графа — карты, в которой кружочки (узлы) представляют единицу информации, соединенную линиями (ребрами), которые представляют связи. Для того чтобы изучить историю ваших поисков, компьютер совершает «прогулку» по графу, пока не считает всю информацию. Ребра и узлы могут быть «весомыми» — узлы записывают, как часто вы посещаете тот или иной сайт. Ребра могут показывать важность отношений. В соцсетях, например, связь «супруг(а)» весомее, чем «сотрудник».

Считается, что вес ребра важнее веса узла. Исследователи Корнелльского университета утверждают, что в Twittere, например, общие интересы значит больше, чем тема, на которую пишет каждый отдельный пользователь.

«Мы как будто свернули миллион узлов в сотню виртуальных узлов».

Алгоритмы, оценивающие вес графов, уже существуют, но они работают медленно. Чтобы ускорить их, ученые сократили граф и убрали все лишнее. Теперь он ищет только соотнесенные узлы — представляющие общие интересы с сильными связями между ними . Абитуриент, выбирающий ВУЗ, посещает много сайтов университетов. Их можно объединить в один большой и важный узел упрощенного графа.

Команда Се протестировала свой метод на базе данных научных публикаций и поисковой системе блогов и обнаружила, что она работает на 5 порядков быстрее, чем современный поисковый механизм.

Но это еще не предел — ученые предполагают, что можно еще больше увеличить скорость, если пользователь загрузит приложение на свой компьютер, и программа произведет необходимые вычисления с его стороны.

За свое исследование Се получил премию «Лучшая студенческая работа» на 21 Конференции по обнаружению информации и поиску данных ACM SIGKDD.

Загрузка...
Подписывайтесь на наши каналы в Telegram

«Хайтек» - новости онлайн по мере их появления

«Хайтек» Daily - подборки новостей 3 раза в день

Big data на страже здоровья: как и зачем медицинские организации собирают и хранят данные
Тренды
Николь Миллс, Booking.com — об инновациях, agile-подходе и индустрии впечатлений
Кейсы
Слишком опасный нанопластик: как одноразовые пакеты превращаются в частицы-убийцы
Тренды
Здесь может быть ваша реклама: НАСА планирует заработать на космосе миллионы
Тренды
Идеи
Человек и квантовая теория: существует ли то, что мы не наблюдаем
Опасный криптотрейдинг: как киберпреступники угрожают виртуальным сбережениям и биржам
Тренды
Как через 20 лет будет выглядеть армия будущего
Тренды
5 финансовых инструментов, которые помогут инвесторам даже после падения криптовалюты
Тренды
Александр Лямин, Qrator Labs: наша задача — выработать у людей цифровую гигиену, чтобы они «не ели с помойки»
Кейсы
Эдуард Фош Вильяронга: люди видят в роботе только внешность, забывая, что он следит за ними
Тренды
Доктор Куэй Во-Райнард, HIT Foundation: если страна требует суверенитета данных, мы построим для нее отдельный блокчейн
Кейсы
Идеи
«Хакинтош»: как собрать свой собственный Mac лучше, чем у Apple
Роботы против мигрантов: какой вклад в ксенофобию и расизм делают технологии ИИ
Тренды
Война скриптов — искусственный интеллект против навязчивой рекламы
Тренды
Как заново изобрести супермаркет: осознанность потребления, этика производства и роботы
Тренды
Каждый человек станет сам себе банком: цифровой мир отказывается от посредников между бизнесом и клиентом
Тренды
Архитектор вычислительной инфраструктуры «Платона» Александр Варламов — о будущем ИТ-индустрии в России, стартапах и разработке
Кейсы
Дмитрий Богданов, капитан сборной России по CS:GO — о стиле жизни киберспортсмена, тренировках и блокировках РКН
Тренды
Идеи
Космос — наш дом: что осталось решить ученым, чтобы поселить человека за пределами Земли
Прайсинг, трекинг, скоринг, биллинг и другие технологии, которые двигают российский бизнес
Тренды
«Педиатр 24/7»: как телемед-стартап подарил родителям спокойствие, а врачам — работу
Кейсы
Вас снова обманули: как человечество учит компьютеры определять фейки в интернете
Тренды
БиСи Бирман, Heavy Projects: ИИ должен иметь несовершенства — это элемент случая
Мнения
Артем Геллер, lab.ag: делая сервис для государства, ты помогаешь своей бабушке
Мнения
Акселераторы и инкубаторы: что выбрать стартапу на раннем этапе развития
Мнения
Вопрос доверия: как и почему изменилось отношение к телемедицине в России
Тренды
Правительственные криптопесочницы: как освободить финтех от давления закона и защитить потребителей
Тренды
Кейсы
Роман Нестер, Segmento: я верю корпорациям больше, чем маленьким компаниям
Суперагенты в недвижимости: как блокчейн и большие данные заменяют риелторов
Тренды
СМИ будущего: вертикальные видео, новости по запросу и смерть сайтов
Тренды
Тренды
Колонизация отменяется: почему терраформирование невозможно на Марсе
Сет Стивенс-Давидовиц: у людей гораздо больше непристойных и скверных мыслей, чем мы думали
Мнения
Умные города подвергают своих жителей опасности из-за датчиков освещения и радиации
Тренды
Геронтолог Обри ди Грей: жизнь длиной в тысячу лет — это побочный эффект поиска вечного здоровья
Мнения
Биоценоз в фарме: зачем нужна альтернатива антибиотикам и как работают лекарства нового поколения
Тренды
Чарльз Адлер, co-founder Kickstarter: я — панк-рокер, который раздвигает границы
Кейсы
Как ИИ меняет медицину: личный помощник для врачей, маршрутизатор в клиниках и разработчик лекарств
Кейсы
Эдвин Диндер, Huawei Technologies: умный город — это ничто
Мнения
«Если изобретение с ИИ не приносит пользу, сам продукт никому не нужен»
Мнения
Feature engineering: шесть шагов для создания успешной модели машинного обучения
Тренды
Мнения
Человек — это набор из пяти чисел: Игорь Волжанин, DataSine — о психотипировании с помощью big data
Карло Ратти, Senseable City Laboratory (MIT) — о городах будущего, третьей коже человека и роболодках
Тренды
Мы все — сенсоры: CEO SQream Ами Галь — о том, как обрабатывают big data
Кейсы
Что такое скрапинг: как Amazon, Walmart и другие ритейлеры используют ботов в борьбе с конкурентами
Идеи
Почему китайские подлодки-беспилотники станут самым опасным врагом под водой?
Идеи
Филипп Роуд, LSE Cities: самый кошмарный сценарий — беспилотники, ездящие по городу, чтобы не платить за парковку
Мнения
Юрий Корженевский — о том, как построить безопасные системы для банков на блокчейне
Блокчейн
Иннополис
Russian Robot Olympiad: как дети строят роботов и решают реальные инженерные проблемы
MyGenetics: ДНК-тесты, помогающие «взломать» организм, как компьютер
Тренды