Искусственный интеллект не просто проник в нашу жизнь, но возглавил все возможные чарты и рейтинги. По версии британского словаря Collins, словом 2023 года стал сам термин «AI» (ИИ — прим.ред.), а по версии российского Института Пушкина — связанный с ИИ термин «нейросеть». Лидер в области технологического и инвестконсалтинга GP Bullhound назвал ИИ технологией 2024 года. Специально ко Дню российской науки Артур Кадурин, руководитель научной группы «Глубокое обучение в науках о жизни» Института искусственного интеллекта AIRI, описал для «Хайтека» ключевые понятия и категории, которые помогут лучше разобраться в одном из наиболее сложных направлений сектора DeepTech.
А
Алгоритм предсказания — одно из базовых понятий в ИИ, которое определяет способ предсказания и предложения необходимой информации в результате анализа данных. С помощью алгоритмов голосовой помощник отвечает на ваш вопрос, онлайн-кинотеатр предлагает интересный фильм, а система мониторинга предсказывает возможные сбои в работе.
Архитектура нейросети — структура, которая определяет, как нейроны в нейронной сети связаны и взаимодействуют друг с другом. Она определяет, какие функции будут выполняться на каждом этапе обработки данных и как информация будет передаваться между различными слоями сети. Архитектура может различаться в зависимости от назначения нейросети и используемых алгоритмов обучения. Например, сверточные нейронные сети используются для распознавания образов, а рекуррентные нейронные сети — для обработки естественного языка.
Б
Байесовские сети — модель, представляющая собой множество переменных и их вероятностных зависимостей. Например, байесовская сеть может быть использована для вычисления вероятности заболевания по наличию или отсутствию ряда симптомов. Так, только вернувшемуся из Африки пациенту с жаром и ломотой в теле, вероятно, будет диагностирована малярия, исходя из выраженной симптоматики.
Бустинг — метод, который используют в машинном обучении для уменьшения количества ошибок при прогностическом анализе данных. Простыми словами, бустинг использует идею того, что следующая модель будет учиться на ошибках предыдущей, тем самым увеличивая общую точность метода.
В
Воплощенный ИИ — область искусственного интеллекта, которая изучает способы взаимодействия между компьютерами и физическим миром. В отличие от традиционных подходов, где интеллект сосредоточен в компьютерных программах, воплощенный интеллект использует системы, которые могут взаимодействовать с окружающей средой, используя физические сенсоры. Другими словами, воплощенный искусственный интеллект позволяет роботу самостоятельно формировать последовательности действий и выполнять задачи по запросу пользователя на естественном языке, а не по заранее заданному разработчиком алгоритму в виде последовательности команд на языке программирования.
Г
Галлюцинации — особенность нейронной сети выдавать несуществующие факты за реальные. Полученные утверждения звучат правдоподобно, но не соответствуют действительности. С технической точки зрения искусственный интеллект «не знает», что то, что он говорит — ложь, поэтому явление называется галлюцинациями.
Адвокат из Нью-Йорка Стивен Шварц использовал нейронную сеть, чтобы найти дела, которые он мог бы процитировать на юридическом брифинге. Шварц не осознавал, что случаи, предложенные ИИ, были галлюцинациями, пока его не попросили предоставить копии дел.
Глубинный анализ данных — процесс обнаружения в данных ранее неизвестных и практически полезных знаний, необходимых для принятия решений в различных сферах человеческой деятельности. Основу интеллектуального анализа данных составляют всевозможные методы классификации, моделирования и прогнозирования.
Градиентный спуск — наиболее распространенный и один из первых алгоритмов оптимизации, который используется во многих моделях машинного обучения. Используя математическую формулу, алгоритм корректирует «мышление» в поисках верной закономерности и правильного ответа. Например, вы хотите научить программу предсказывать размер ноги человека, исходя из его роста. Алгоритм случайно предполагает взаимосвязь между параметрами, затем вычисляет ошибки между своим и фактическим результатами из тестового датасета. В дальнейшем параметры модели корректируется до момента, пока ошибка не будет сведена к минимуму.
Д
Датасет представляет собой набор данных, которые используются в различных видах анализа и машинного обучения. Причем считается, что успешность последнего напрямую зависит от объема исходной информации: чем ее больше, тем качественнее будет развиваться ИИ.
З
Закон Хуанга — утверждение, представленное Дженсеном Хуангом, генеральным директором и президентом компании-разработчика графических процессоров для высокопроизводительных вычислений NVIDIA. В 2018 году в ходе своего выступления он отметил, что процессоры компании стали в 25 раз быстрее за последние 5 лет, что значительно превышает прогнозы, основанные на «законе Мура», согласно которому количество транзисторов на кристалле интегральной схемы удваивается каждые 24 месяца. Дженсен Хуанг также высказывал мнение о том, что «закон Мура мёртв» и что цены на микрочипы будут расти. Новый «закон Хуанга» подчеркивает значимость инноваций в области программного обеспечения и архитектуре как движущей силы захватывающего роста мощности видеокарт NVIDIA.
И
Инференс. В жизни нейросети существует три фазы: обучение модели (тренировка), развертывание и непосредственное применение — что и называется инференсом. Часто инференсом называют процесс работы уже обученной нейросети на конечном устройстве или ее логический вывод (конечный результат обработки данных).
К
Компьютерное зрение — подобласть компьютерных наук, искусственного интеллекта и машинного обучения, которая стремится дать компьютерам быстрое, высокоуровневое и близкое к человеческому понимание изображений и видео. В последние годы компьютерное зрение демонстрирует отличные результаты в точности и скорости благодаря глубокому обучению и нейронным сетям.
Л
Логистическая регрессия — метод анализа данных, который использует математику для поиска взаимосвязей между двумя факторами данных. Затем эта взаимосвязь используется для прогнозирования значения одного из этих факторов на основе другого. Предсказание обычно имеет определенный результат, например, «да» или «нет».
М
Модель искусственного интеллекта — программа, обученная на наборе данных для распознавания определенных типов шаблонов. В моделях ИИ используются различные типы алгоритмов для анализа и изучения этих данных с целью решения бизнес-задач.
Н
Нейроморфные компьютеры имитируют функции мозга, используя программируемые искусственные нейроны и обеспечивают более эффективное распознавание образов, особенно в ситуациях, когда некоторые данные не определены или информация отсутствует. Они также отличаются способностью к более эффективному реагированию на реальные данные, в отличие от классических компьютеров, обрабатывающих информацию последовательно.
NLP (Natural Language Processing) — общее направление искусственного интеллекта и математической лингвистики. Оно изучает проблемы компьютерного анализа и синтеза текстов на естественных языках.
О
Обнаружение живости — функция безопасности для систем аутентификации по лицу для проверки того, что данное изображение или видео представляет собой живого, подлинного человека, а не является попыткой мошеннического обхода системы (например, путем ношения маски, похожей на человека, или путем отображения спящего лица). Обнаружение живости необходимо для защиты от злоумышленников.
Обучение нейросетей — процесс обучения нейронной сети решению задачи. Нейронные сети обучаются путем первичной обработки больших наборов размеченных или неразмеченных данных. На основе этих примеров сети могут более точно обрабатывать неизвестные входные данные.
П
Перцептрон — одна из первых разработок в области нейронных сетей. Она представляет собой алгоритм, который пытается имитировать работу нейронов в человеческом мозге. Основным принципом работы перцептрона является обработка входных данных и принятие решений на основе полученной информации.
Промт — запрос для ИИ, который помогает запустить генерацию необходимых данных. Без качественного запроса искусственный интеллект не сможет сформулировать четкий и понятный ответ. С развитием технологии появился запрос и на сотрудников, которые генерируют данные запросы — промт-инженеров, которые буквально переводят запрос с «человеческого» на язык, понятный искусственному интеллекту.
Р
Рекуррентные нейронные сети (РНС) — модель машинного обучения, которая настроена обрабатывать набор динамических данных или последовательности. РНС используются для решения задач, связанных с последовательностями данных. Например, для анализа и распознавания текста или звука. РНС могут обучаться на больших объемах данных и затем предсказывать новые последовательности.
С
Сегментация — процесс разбивки изображения на группы с учетом подобия характеристик пикселей. Основная идея этого процесса состоит в следующем: каждый пиксель изображения может быть связан с некоторыми визуальными свойствами, такими как яркость, цвет и текстура.
Т
Трансформер — один из ключевых видов нейросетей. Нужен для обработки последовательностей с возможностью учитывать зависимости элементов, расположенных далеко друг от друга в последовательности. На сегодняшний день это самая продвинутая техника в области обработки естественного языка (NLP).
Ф
Файнтюнинг — процесс дообучения нейросети под конкретную задачу. Процесс выстроен следующим образом: разработчики, например, обучают нейросеть классифицировать миллиарды изображений на тысячу общих классов, а затем точечно дообучают ее под конкретную индустриальную задачу. Таким образом общая модель сводится к более частной.
Функция ошибки — функция, определяющая, насколько сильно ошиблась модель. Чем точнее модель угадывает ответ, тем меньше значение функции ошибки. Сигнал об ошибке подается на вход методу обучения, что приводит к коррекции модели. В итоге модель меняет свое состояние в зависимости от входных объектов, то есть обучается.
Х
Хинтон Джеффри — британский и канадский ученый, который внес значительный вклад в изучение и развитие глубокого обучения. Джеффри называют «крестным отцом» искусственного интеллекта. В 2012 году профессор Хинтон разработал систему, которая могла анализировать тысячи снимков и обучать саму себя распознавать в реальности похожие объекты — например, цветы, животных или автомобили — с беспрецедентной точностью. Именно разработки британского профессора и двух его студентов ускорили внедрение ИИ — и привели к появлению ChatGPT, Google Bard и других чат-ботов.
Ц
Цифровой двойник — это цифровая (виртуальная) модель любых объектов, систем, процессов или людей. Она точно воспроизводит форму и действия оригинала и синхронизирована с ним.
Ч
Черный ящик — одна из ключевых проблем современного искусственного интеллекта, предполагающая, что разработчик не может заглянуть внутрь модели и понять, почему система предложила то или иное решение.
Ш
Шмидхубер Юрген — всемирно известный швейцарский ученый в области искусственного интеллекта. Созданные в его лаборатории нейронные сети глубокого обучения произвели революцию в машинном обучении и искусственном интеллекте. Сейчас работает над передовыми технологиями и приложениями искусственного интеллекта для улучшения здоровья человека и продления жизни.
Шэньчжэньский интеллектуальный двойник (Shenzhen Intelligent Twin) — система умного города, создание которой компания Huawei анонсировала совместно с руководством города Шэньчжэнь. Разработка позволит собирать и обрабатывать информацию, принимать решения, развиваться и обеспечивать более комфортную для граждан и бизнеса среду, что в конечном счете поможет сделать город более цифровым, «умным» и удобным.
Э
Этика ИИ — единая система рекомендательных принципов и правил, предназначенных для создания среды доверенного развития технологий ИИ. Этика ИИ рассматривается в двух основных аспектах: этические принципы, лежащие в основе принимаемых ИИ-решений, и этичное поведение ИИ в ситуации, напрямую касающейся людей. Второй аспект принципиально отличает этику ИИ от этики других цифровых технологий.
Ю
Ю-нет (U-Net) — свёрточная нейронная сеть, предназначенная для быстрой и точной сегментации изображений. Используется в решении задач машинного обучения. Она умеет не только определять классы на визуальном материале, но и сегментировать области, то есть создавать маску, которая будет визуально разделять изображение на несколько классов.
Я
Языковые модели — большие нейронные сети, которые обучаются предсказывать следующее слово (или часть слова) в тексте с учетом предыдущего контекста. Несмотря на кажущуюся простоту, оказалось, что такая постановка задачи приводит к появлению весьма многофункциональной нейронной сети.