Новые возможности ИИ впечатляют.
OpenAI начала разворачивать анонсированную более полугода назад функцию видения, которая позволяет чат-боту ChatGPT предоставлять информацию, анализируя видео с камеры или экрана в реальном времени.
Голосовой режим Advanced Voice Mode в ChatGPT теперь позволяет пользователям взаимодействовать с чат-ботом, демонстрируя ИИ, что происходит вокруг них, просто наводя камеру смартфона на объекты. Так же можно получить помощь чат-бота с тем, что происходит на экране компьютера, с помощью совместного доступа к экрану. Сейчас функция зрения доступна только для пользователей с подпиской ChatGPT Plus, Team или Pro и не во всех странах.
«Все пользователи Team и большинство пользователей Plus и Pro получат доступ в течение следующей недели в новой версии мобильного приложения ChatGPT. Мы предоставим эту функцию пользователям Plus и Pro в ЕС, Швейцарии, Исландии, Норвегии и Лихтенштейне как можно быстрее. Пользователи Enterprise и Edu получат доступ в начале 2025 года», — сообщает OpenAI.
Just in time for the holidays, video and screensharing are now starting to roll out in Advanced Voice in the ChatGPT mobile app. pic.twitter.com/HFHX2E33S8
— OpenAI (@OpenAI) December 12, 2024
Для того чтобы воспользоваться функцией зрения, нужно открыть голосовой режим чат-бота, нажав соответствующую кнопку внизу, а затем начать транслировать видео, нажав на кнопку с камерой. После этого чат-бот начнет анализировать изображение с камеры смартфона, чтобы использовать полученную информацию для ответов на вопросы. На короткой демонстрации в X команда разработчиков показала принцип работы этого режима с помощью простой задачи. Разработчик показал чат-боту своих коллег, каждый из них представился. Затем разработчик предложил чат-боту тест: он спрашивал, как зовут коллегу, надевшую оленьи рога, и как зовут коллегу в шапке Санты. Чат-бот с легкостью справился с этой задачей.
Конкуренты OpenAI, как Google и Meta, работают над подобными возможностями для своих продуктов с ИИ. На этой неделе Google представила свою функцию разговорного искусственного интеллекта Project Astra, работающую в реальном времени и анализирующую видео, для группы тестировщиков.