
OpenAI представив довгоостійне вдосконалення зображень. Тепер, замість окремої моделі, наприклад, Dall · E, новий вдосконалений генератор зображень є частиною GPT-4O.
На ринку є багато моделей SI, щоб створити вражаючі візуальні сцени, але вони часто відчувають труднощі з відображенням тексту, логотипів та інших елементів, які рідко не зустрічаються в повсякденному житті.
OpenAi стверджує, що його нове покоління зображень GPT-4O вирішує ці недоліки. Він може точно відтворити текст, і краще дотримуватися інструкцій завдяки своїм знанням та контекстом. Крім того, нова модель дозволяє редагувати завантажені зображення або створювати нові моделі за допомогою завантаженого зображення як візуального натхнення.
Доступність та нові можливості
Оновлений генератор зображень у GPT-4O вже починає розгортатися для всіх користувачів Chatgpt Plus, Pro, Team та безкоштовно. Оскільки ця модель буде стандартною для генерування зображень у Chatgpt, користувачам більше не потрібно вибирати її вручну перед введенням запиту.
Користувачі можуть налаштувати зображення, вказуючи сторони, точні кольори (шестикутні коди) або навіть прозорий фон. У найближчі тижні також з’явиться новий генератор для користувачів Chatgpt Enterprise та EDU.
Нова модель також може бути використана в SORA для створення зображень або через спеціальний Dall · E GPT. Для розробників допоміжне покоління зображень через API GPT-4O з’явиться в найближчі тижні.
Моделювання спеціальних проектів3D – це тенденція 2025 року. Чому це перспективна професія, яка може бути доходом і як розпочати магічні монітори, не тільки показують гру, але й занурені в неї!
Обмеження моделі
Незважаючи на численні вдосконалення, модель все ще має деякі обмеження:
- Час покоління – це збільшення деталей створення зображень, щоб зайняти до однієї хвилини.
- Рамка – довгі зображення, такі як плакати, можна вирізати занадто щільно, особливо нижче.
- Вигадування деталей – у запитах з недостатньою контекстною інформацією, модель може «думати» про деталі.
- Обмеження знань. Коли створення складних понять (наприклад, повна таблиця періодичної таблиці), модель може бути неточно відтворена одночасно понад 10-20 об’єктів.
- Труднощі з мовами, що не є викладачами – символи можуть відображатися неправильно або спотворені.
- Редагування зображень – Корекція окремих частин (наприклад, орфографічні помилки) не завжди працює без змін у зображенні.
- Невеликі проблеми з деталями – модель може неправильно відображати невеликі деталі.
OpenAI планує виправити ці обмеження в найближчі тижні та місяці.
Усі зображення, створені цим генератором, містять C2PA-Metadan, а внутрішній інструмент OpenAI зможе перевірити їх походження.
Незважаючи на деякі обмеження, новий генератор зображень GPT-4O значно збільшує точність та гнучкість створення зображень. OpenAI обіцяє подальші вдосконалення, тому користувачі чекають ще кращого та зручного інструменту для роботи з зображеннями.
Нещодавно OpenAI запустив GPT-4.5, але з обмеженим доступом, GPU.
Спеціальна тривалість гесектики вже відкрила попереднє замовлення на ноутбуці MSI GeForce RTX 50MAGSAFE або QI? Як вибрати бездротовий зарядний пристрій Belkin для iPhone та інші гаджети
