Большинство ученых скрывают исходные данные своих ИИ-исследований

Исследования, связанные с ИИ, – непрозрачная и сложная история пишет журнал Science. Главная проблема в том, что большинство исследователей не публикуют исходный код своих работ и обучающую алгоритм выборку. Это приводит к тому, что воссоздать результаты работы почти невозможно, а значит нельзя устроить полноценное сравнение или организовать работу по улучшению результатов. 

Издание ссылается на исследование профессора Норвежского университета естественных и технических наук Одда Эрика Гюндерсена. Тот изучил 400 работ в сфере искусственного интеллекта, представленных на конференциях в течение нескольких последних лет. Оказалось, что только в 6% из них представлен исходный код. Половина работ идет с ограниченным описанием алгоритма, представленном в формате псевдокода. И только треть ученых поделилась данными, на которых проводились исследования.

Физики из МТИ открыли новую форму света

Гюндерсен считает это большой проблемой, близкой к кризису. Невозможность воспроизвести эксперименты с ИИ других ученых ставит их результаты под вопрос. Помимо кризиса доверия, такая практика и в целом тормозит всю область машинного обучения. К слову, ранее с кризисом воспроизводимости столкнулась психология, медицина и другие области науки. Но считалось, что область, связанная с ИИ, защищена от этого, ведь всегда есть исходный код, есть данные — все это позволяет воспроизводить эксперименты до мельчайших подробностей. Но на практике все иначе.

Исследователи находят тысячи причин, чтобы не публиковать тренировочную выборку и исходный код, пишет издание. Они начинаются с объективных — соглашение о неразглашении или желание обогнать конкурентов — и заканчиваются «детскими» отговорками, вроде, «у нас полетел жесткий диск с данными». И Гюндерсен, и Science понимают причины, препятствующие публикации исходных данных, но протестуют против того, чтобы это тормозило развитие ИИ.

Как биотехнолог из Кирова стал одним из лучших ИТ-экспертов планеты

Другие ученые, например, Питер Хендерсон из Университета Макгилл в Монреале, отмечают, что именно в области машинного обучения и ИИ особенно важны точные исходные данные. Говоря «точные», он имеет в виду совпадение до последнего знака в коде. Он также подразумевает, что данные для тренировки алгоритма должны быть представлены. Свое мнение он подтверждает на примерах, запуская один и тот же алгоритм с самыми незначительными изменениями в тренировочной выборке или в коде. По описанию, это по-прежнему одна и та же программа, но результаты абсолютно противоположные. Поэтому Science, Гюндерсен и его коллеги приходят к выводу, что без исходного кода полноценное сравнение и реакция на работы в сфере ИИ других ученых невозможны.​

Подписывайтесь
на наши каналы в Telegram

«Хайтек»новостионлайн

«Хайтек»Dailyновости 3 раза в день

Первая полоса
У зонда летящего к Меркурию произошел сбой двигателя
Космос
Замороженная ткань мозга восстановилась после 18 месяцев криоконсервации
Наука
Редкий глубоководный кальмар попал на видео, напав на подводную камеру
Наука
Экспресс-тест обнаруживает инсульт менее чем за шесть часов после первых симптомов
Наука
Канадский фермер, возможно, нашел на поле обломок ракеты SpaceX
Космос
Квантовую связь создали с помощью обычного городского оптоволоконного кабеля
Новости
Частный спутник сфотографировал МКС с расстояния 70 км
Космос
Ученые сварили пиво с помощью пчел-убийц
Наука
В НАСА рассказали, что вызвало самую мощную геомагнитную бурю десятилетия
Космос
Суперноги от MIT помогут людям быстро вставать после падений на Луне
Космос
Первому в мире ребенку вылечили глухоту с помощью генной терапии
Наука
Ученые нашли семь звезд в Млечном Пути, рядом с которыми могут жить инопланетяне
Космос
Забота об экологии и цифровой мир: какой софт помогает заботиться об окружающей среде?
Мнения
«Уэбб» поймал самое старое слияние черных дыр: через 740 млн лет после Большого взрыва
Космос
Искусственный интеллект научили распознавать сарказм
Новости
«Хаббл» показал галактику странной формы в высоком разрешении
Космос
Оказалось, «сбой» в теории Эйнштейна может объяснить нашу Вселенную
Космос
Фото природной аномалии из космоса опубликовал американский астронавт
Космос
«Хаббл» показал, как свет трех звезд разрывает туманность
Космос
Суперточный робот прооперировал зерно кукурузы: эксперимент показали на видео
Новости