Большинство ученых скрывают исходные данные своих ИИ-исследований

Исследования, связанные с ИИ, – непрозрачная и сложная история пишет журнал Science. Главная проблема в том, что большинство исследователей не публикуют исходный код своих работ и обучающую алгоритм выборку. Это приводит к тому, что воссоздать результаты работы почти невозможно, а значит нельзя устроить полноценное сравнение или организовать работу по улучшению результатов. 

Издание ссылается на исследование профессора Норвежского университета естественных и технических наук Одда Эрика Гюндерсена. Тот изучил 400 работ в сфере искусственного интеллекта, представленных на конференциях в течение нескольких последних лет. Оказалось, что только в 6% из них представлен исходный код. Половина работ идет с ограниченным описанием алгоритма, представленном в формате псевдокода. И только треть ученых поделилась данными, на которых проводились исследования.

Физики из МТИ открыли новую форму света

Гюндерсен считает это большой проблемой, близкой к кризису. Невозможность воспроизвести эксперименты с ИИ других ученых ставит их результаты под вопрос. Помимо кризиса доверия, такая практика и в целом тормозит всю область машинного обучения. К слову, ранее с кризисом воспроизводимости столкнулась психология, медицина и другие области науки. Но считалось, что область, связанная с ИИ, защищена от этого, ведь всегда есть исходный код, есть данные — все это позволяет воспроизводить эксперименты до мельчайших подробностей. Но на практике все иначе.

Исследователи находят тысячи причин, чтобы не публиковать тренировочную выборку и исходный код, пишет издание. Они начинаются с объективных — соглашение о неразглашении или желание обогнать конкурентов — и заканчиваются «детскими» отговорками, вроде, «у нас полетел жесткий диск с данными». И Гюндерсен, и Science понимают причины, препятствующие публикации исходных данных, но протестуют против того, чтобы это тормозило развитие ИИ.

Как биотехнолог из Кирова стал одним из лучших ИТ-экспертов планеты

Другие ученые, например, Питер Хендерсон из Университета Макгилл в Монреале, отмечают, что именно в области машинного обучения и ИИ особенно важны точные исходные данные. Говоря «точные», он имеет в виду совпадение до последнего знака в коде. Он также подразумевает, что данные для тренировки алгоритма должны быть представлены. Свое мнение он подтверждает на примерах, запуская один и тот же алгоритм с самыми незначительными изменениями в тренировочной выборке или в коде. По описанию, это по-прежнему одна и та же программа, но результаты абсолютно противоположные. Поэтому Science, Гюндерсен и его коллеги приходят к выводу, что без исходного кода полноценное сравнение и реакция на работы в сфере ИИ других ученых невозможны.​

Подписывайтесь
на наши каналы в Telegram

«Хайтек»новостионлайн

«Хайтек»Dailyновости 3 раза в день

Первая полоса
«Хаббл» показал, как свет трех звезд разрывает туманность
Космос
Суперточный робот прооперировал зерно кукурузы: эксперимент показали на видео
Новости
Наводнение в Бразилии показали из космоса: как оно выглядит
Космос
Посмотрите на фото северного сияния в 150 мегапикселей
Космос
Посмотрите на крошечную луну Юпитера: обычно ее не разглядеть
Космос
Ученые создали робота, который двигается, как улитка
Новости
Стартовал прием заявок на студкемп Яндекса по математике в ИИ
Новости
Супер-ИИ для учебы и поддержки, нейросеть для творчества, поиск по видео и мощный процессор — главное с Google I/O
Кейсы
По соседству с нашей галактикой нашли три старейшие звезды: откуда они появились
Космос
Посмотрите на астероид, который пролетел очень близко к Земле
Космос
Рядом с нами нашли планету размером с Землю: год там длится 17 часов
Космос
Загадочную аномалию нашли у пирамид Гизы: ученые не знают, что это
Наука
Минздрав уточнил информацию о «запрещенных» для водителей препаратах
Наука
Второй суперкомпьютер преодолел экзофлопсный барьер
Новости
Вулканический пепел предложили использовать для хранения солнечной энергии
Наука
Квадрокоптер установил мировой рекорд: он разогнался до 480 км/ч
Новости
Созданы умные контактные линзы для взаимодействия с компьютером
Новости
На Солнце произошла самая мощная вспышка почти за 20 лет
Космос
Google дополнит привычный поиск в сети ответами искусственного интеллекта
Новости
Посмотрите на огромную плотину из космоса
Космос