Большинство ученых скрывают исходные данные своих ИИ-исследований

Исследования, связанные с ИИ, – непрозрачная и сложная история пишет журнал Science. Главная проблема в том, что большинство исследователей не публикуют исходный код своих работ и обучающую алгоритм выборку. Это приводит к тому, что воссоздать результаты работы почти невозможно, а значит нельзя устроить полноценное сравнение или организовать работу по улучшению результатов. 

Издание ссылается на исследование профессора Норвежского университета естественных и технических наук Одда Эрика Гюндерсена. Тот изучил 400 работ в сфере искусственного интеллекта, представленных на конференциях в течение нескольких последних лет. Оказалось, что только в 6% из них представлен исходный код. Половина работ идет с ограниченным описанием алгоритма, представленном в формате псевдокода. И только треть ученых поделилась данными, на которых проводились исследования.

Физики из МТИ открыли новую форму света

Гюндерсен считает это большой проблемой, близкой к кризису. Невозможность воспроизвести эксперименты с ИИ других ученых ставит их результаты под вопрос. Помимо кризиса доверия, такая практика и в целом тормозит всю область машинного обучения. К слову, ранее с кризисом воспроизводимости столкнулась психология, медицина и другие области науки. Но считалось, что область, связанная с ИИ, защищена от этого, ведь всегда есть исходный код, есть данные — все это позволяет воспроизводить эксперименты до мельчайших подробностей. Но на практике все иначе.

Исследователи находят тысячи причин, чтобы не публиковать тренировочную выборку и исходный код, пишет издание. Они начинаются с объективных — соглашение о неразглашении или желание обогнать конкурентов — и заканчиваются «детскими» отговорками, вроде, «у нас полетел жесткий диск с данными». И Гюндерсен, и Science понимают причины, препятствующие публикации исходных данных, но протестуют против того, чтобы это тормозило развитие ИИ.

Как биотехнолог из Кирова стал одним из лучших ИТ-экспертов планеты

Другие ученые, например, Питер Хендерсон из Университета Макгилл в Монреале, отмечают, что именно в области машинного обучения и ИИ особенно важны точные исходные данные. Говоря «точные», он имеет в виду совпадение до последнего знака в коде. Он также подразумевает, что данные для тренировки алгоритма должны быть представлены. Свое мнение он подтверждает на примерах, запуская один и тот же алгоритм с самыми незначительными изменениями в тренировочной выборке или в коде. По описанию, это по-прежнему одна и та же программа, но результаты абсолютно противоположные. Поэтому Science, Гюндерсен и его коллеги приходят к выводу, что без исходного кода полноценное сравнение и реакция на работы в сфере ИИ других ученых невозможны.​

Подписывайтесь
на наши каналы в Telegram

«Хайтек»новостионлайн

«Хайтек»Dailyновости 3 раза в день

Первая полоса
«Хаббл» показал галактику с прожорливой черной дырой
Новости
Авторы ChatGPT назвали свой ИИ смехотворным
Новости
Посмотрите на обновленную Nokia 3210: что умеет этот гаджет
Новости
Какие компании готовы нанимать джунов и с какими навыками — исследование
Новости
Ученые нашли «новый» генетический вариант болезни Альцгеймера
Новости
Оказывается, популярная диета защитила печень от воспаления
Новости
SpaceX показала скафандр для первой частной миссии по выходу в открытый космос
Космос
OpenAI запустит поисковый сервис ChatGPT для конкуренции с Google
Новости
Геологи обнаружили древний вулканизм на обратной стороне Луны
Космос
Физики, возможно, впервые наблюдали глюоний: эти частицы состоят только из силы
Наука
Екатерина Барабанова, Ростелеком – о том, как построить карьеру в образовании и HR
Мнения
Японская станция сфотографировала мусор в космосе: это первый шаг к очистке орбиты
Космос
Шесть анонсов с презентации Apple новых iPad
Новости
Семь загадок Солнечной системы и Солнца, которые ученые пока не решили
Кейсы
Посмотрите, что будет с вами при падении в черную дыру
Новости
Сибирские «врата в подземный мир» растут: что происходит в Батагайке
Новости
Оказалось, в прошлом Марс был больше похож на Землю, чем все думали
Наука
Крепость римских легионеров, которой 2000 лет, нашли рядом с собором
Наука
Терапия светом помогла при травмах позвоночника
Наука
Робот-гуманоид с электроприводом может работать вслепую
Новости