Компанія OpenAI випустила оновлену модель чатбота зі штучним інтелектом GPT-4O, яка буде безкоштовною для всіх користувачів. Про це повідомляє Полемика з посиланням на блог компанії.
За словами гендиректора Сема Альтмана, ця модель є «мультимодальною», а це означає, що вона може генерувати контент, розуміючи команди користувача голосом, у тексті та в зображеннях.
Технічна директорка компанії Міра Мураті додатково розповіла про можливості чатбота GPT-4O. Вона зазначила, що вдосконалена модель набагато швидша та покращує можливості взаємодії в тексті, візуалізації та аудіо.
Як наголосила Мураті, GPT-4O є кроком до більш природної взаємодії між людиною та комп’ютером.
«Вона приймає як вхідні дані будь-яку комбінацію тексту, аудіо та зображень та генерує будь-яку потрібну комбінацію тексту, аудіо та зображень. GPT-4О може реагувати на аудіозапит у середньому за 320 мілісекунд, що приблизно відповідає часу реакції людини в розмові», — пояснили у блозі компанії.
Розробники чат-боту запевняють, що ця модель не лише швидша та мультимодальна, але й краще розрізняє емоційне забарвлення голосових завдань користувача.
Серед інших новацій:
- можливість коригувати «завдання» голосовими командами без потреби натискань клавіш;
- можливість використовувати її як інтерактивного перекладача;
- «запам’ятовування» згенерованих зображень, наприклад, персонажа і подальше їх розміщення в усе нових сценах;
- можливість взаємодії за допомогою відео — модель визначає, де перебуває користувач, і продукує відповідні тематичні рекомендації.
Раніше Полемика писала про те, що Instagram анонсував низку нововведень для Stories.