Нова модель отримала назву Chat GPT-4O і стане доступною для всіх користувачів у світі найближчими тижнями.

Компанія OpenAI випустила оновлену модель чатбота зі штучним інтелектом GPT-4O, яка буде безкоштовною для всіх користувачів. Про це повідомляє Полемика з посиланням на блог компанії.

За словами гендиректора Сема Альтмана, ця модель є «мультимодальною», а це означає, що вона може генерувати контент, розуміючи команди користувача голосом, у тексті та в зображеннях.

Технічна директорка компанії Міра Мураті додатково розповіла про можливості чатбота GPT-4O. Вона зазначила, що вдосконалена модель набагато швидша та покращує можливості взаємодії в тексті, візуалізації та аудіо.

Як наголосила Мураті, GPT-4O є кроком до більш природної взаємодії між людиною та комп’ютером.

«Вона приймає як вхідні дані будь-яку комбінацію тексту, аудіо та зображень та генерує будь-яку потрібну комбінацію тексту, аудіо та зображень. GPT-4О може реагувати на аудіозапит у середньому за 320 мілісекунд, що приблизно відповідає часу реакції людини в розмові», — пояснили у блозі компанії.

Розробники чат-боту запевняють, що ця модель не лише швидша та мультимодальна, але й краще розрізняє емоційне забарвлення голосових завдань користувача.

По теме:  Американо-украинский security-стартап привлек $35 млн

Серед інших новацій:

  • можливість коригувати «завдання» голосовими командами без потреби натискань клавіш;
  • можливість використовувати її як інтерактивного перекладача;
  • «запам’ятовування» згенерованих зображень, наприклад, персонажа і подальше їх розміщення в усе нових сценах;
  • можливість взаємодії за допомогою відео — модель визначає, де перебуває користувач, і продукує відповідні тематичні рекомендації.

Раніше Полемика писала про те, що Instagram анонсував низку нововведень для Stories.