Анализ видео, песни и голосовой помощник: что может новый бесплатный ChatGPT

OpenAI представила GPT-4o — более быструю большую языковую модель, ограниченно доступную бесплатно для всех пользователей ChatGPT.

OpenAI запускает новую версию большой языковой модели GPT-4o. Обновленный ИИ «намного быстрее», улучшает возможности взаимодействия с помощью текста, аудио и визуальных данных и будет бесплатно доступен всем пользователям ChatGPT, заявила технический директор компании Мира Мурати во время презентации в прямом эфире. Серьезные изменения также ожидаются в пользовательском интерфейсе для работы с чат-ботом.

В блоге компании отмечается, что новые функции и другие изменения будут появляться постепенно в течение ближайших недель, а первые обновления для работы с текстом и изображениями стали доступным некоторым пользователям сразу после презентации.

В общедоступной версии по умолчанию будет использоваться GPT-4o с ограничением на количество сообщений, которое варьируется в зависимости от загрузки серверов. После исчерпания лимита пользователя автоматически переключат на старую версию GPT-3.5. По подписке можно отправить до 80 сообщений каждые 3 часа при использовании GPT-4o и до 40 сообщений — к GPT-4.

Генеральный директор OpenAI Сэм Альтман отметил, что модель «изначально мультимодальная», то есть может генерировать контент или понимать голосовые, текстовые или визуальные команды. Для разработчиков доступен API, который вдвое дешевле и в два раза быстрее, чем GPT-4 Turbo, добавил Альтман в своем блоге в социальной сети X.

Особое внимание в презентации компании обращают на использование голосового режима, который превращает ChatGPT в альтернативу голосовому помощнику. Разработчики отмечают, что им удалось существенно ускорить время отклика, приблизив его к человеческой речи: средняя реакция для голосовых сообщений на английском языке составляет всего 323 мс. Всего модель поддерживает 50 языков, включая русский. Для сравнения в GPT-3.5 аналогичная задержка, связанная с обработкой данных, составляла 2,8 секунды, а в GPT-4 — 5,4 секунды. Данные для других языков не приводятся, но отмечается, что и для них речевой режим стал гораздо быстрее.

В демонстрационных видео, опубликованных в блоге компании, показаны некоторые варианты возможного использования новых голосовых возможностей и функций для работы с мультимедиа. Например, ChatGPT может выступать в роли синхронного переводчика, позволяя общаться на разных языках, анализировать окружение, помогая выбрать правильное направление, или даже петь. Кроме того, с помощью видео можно, например, показать, где вы застряли в решении сложной математической задачки, ИИ поможет с решением и объяснит правила.

Помимо обновленной веб-версии и мобильного приложения компания сообщила о запуске программы для ПК, в котором будут доступны все те же функции. Пока опубликована версия для MacOS, для компьютеров на базе других операционных систем приложение появится в ближайшее время. В приложении можно делиться скриншотами, фотографиями и документами, спрашивать ChatGPT о предыдущих разговорах, искать информацию в реальном времени и выполнять анализ данных, загружая диаграммы или код перед тем, как задавать вопросы.

Дебют ChatGPT в 2022 году положил начало серии решений в области генеративного ИИ, которая продолжается до сих пор, напоминая гонку вооружений. Релиз новой версии чат-бота состоялся накануне запланированной на вторник конференции Google, на которой, как ожидается, ИТ-гигант представит обновление своего ИИ Gemini. А в июне на Worldwide Developers Conference свою ставку в этой гонке сделает Apple.

Ранее сообщалось, что OpenAI планирует запустить собственную поисковую машину для конкуренции с Google, но, как сообщил Сэм Альтман, этого в ближайшее время не произойдет.


Читать далее:

Оказалось, в прошлом Марс был больше похож на Землю, чем все думали

Сибирские «врата в подземный мир» растут: что происходит в Батагайке

Недалеко от нас есть планета, где ветер дует быстрее пули

На обложке: Image by frimufilms on Freepik, сведения о лицензии

Подписывайтесь
на наши каналы в Telegram

«Хайтек»новостионлайн

«Хайтек»Dailyновости 3 раза в день

Первая полоса
Тайны древней звезды по соседству изучили, «подслушав ее песню»
Космос
Baidu делает ИИ для перевода звуков животных в человеческую речь
Наука
Оказалось, ИИ врет чаще при одном условии: как этого избежать
Новости
Суперкомпьютер Маска сжирает электричество как 300 000 домов: люди протестуют
Новости
Посмотрите, как робот стремительно отбивает подачи в настольном теннисе
Новости
Физики исполнили мечту алхимиков: свинец в коллайдере превратили в золото
Наука
Создано музыкальное приложение для реабилитации после инсульта
Наука
«Эффект аккордеона» превращает жесткий графен в эластичный материал
Наука
ИИ восстановил имя автора свитка, который пережил последний день Помпеи
Наука
Частный лунный модуль вышел на орбиту спутника после двух месяцев полета
Космос
Предок тираннозавра «иммигрировал» в Америку из Азии, считают ученые
Наука
Обновленный Gemini 2.5 Pro от Google возглавил рейтинг ИИ для разработчиков
Новости
Ученые решили проблему, которая мешала запуску термоядерных реакторов почти 70 лет
Наука
Китайское «супероружие» для подводных диверсий оказалось не таким, как считалось
Новости
Отключение мобильного интернета в Москве: какие последствия для бизнеса
Новости
Киберполиция назвала новые схемы мошенников: как они воруют аккаунты на «Госуслугах»
Новости
Хокинг предсказал гибель Земли: оказалось, НАСА сочло угрозу реальной
Наука
Создатель Ethereum признал свои ошибки и решил изменить криптовалюту
Новости
«Ред ОС 8» заработала на Arm-платформах — теперь и на «Байкале»
Новости
Компания Цукерберга использовала уязвимость подростков для рекламы
Новости