OpenAI представила GPT-5.3-Codex: “блискавичний” ШІ для коду з 1000 токенами на секунду

OpenAI представила GPT-5.3-Codex: "блискавичний" ШІ для коду з 1000 токенами на секунду 1 Depositphotos

випускає полегшену версію -агента для кодування GPT-5.3-Codex-Spark, розроблену для пришвидшеної обробки даних.

Чим особливий GPT-5.3-Codex-Spark

Для випуску цієї моделі було використано спеціалізований чип компанії Cerebras, про партнерство з якою на суму у $10 млрд  було оголошено минулого місяця. В OpenAI зазначають, що інтеграція чипа Cerebras покликана прискорити роботу ШІ.

GPT-5.3-Codex-Spark проводитиме прискорені обчислення та працюватиме на базі Wafer Scale Engine 3 від Cerebras — чипі третього покоління з 4 трлн транзисторів. Нова модель ШІ для кодингу має підвищити продуктивність та допомогти користувачам зі швидким прототипуванням. Для більш тривалих та ресурсомістких задач пропонується використовувати версію  GPT-5.3 Codex. 

“Codex-Spark — це перший крок до Codex, який працює у двох доповнюючих один одного режимах: спільна робота в реальному часі, коли потрібна швидка ітерація, і тривалі завдання, коли необхідні глибші міркування та виконання”, — пояснюють в OpenAI.

Наразі Spark вже доступний користувачам Pro за $200 на місяць у застосунку Codex в рамках попереднього тестування. OpenAI також підкреслює, що випустила полегшену модель для забезпечення якомога мінімальної затримки ШІ для кодингу.

Cerebras вже понад 10 років на ринку з виробництва чипів, однак саме розвиток ШІ надав їй можливість відігравати помітну роль у техносекторі. Минулого тижня компанія оголосила про залучення інвестицій у розмірі $1 млрд. Загалом вона оцінюється у $23 млрд.

В OpenAI стверджують, що нова модель програмує у 15 разів швидше, залишаючись високоефективною для реального кодингу. Компанія заявляє, що це перша модель, розроблена для роботи з Codex в режимі реального часу, зокрема, перебудови логіки та уточнення інтерфейсів, а також негайного отримання результату. Більшість інструментів ШІ для програмування потребують певного часу для виконання інструкцій. Це може займати від кількох хвилин і довше.

Spark завдяки поліпшеній адаптивності підтримує більш гнучкий діалоговий кодинг. Модель підтримує переривання та перенаправлення виконання завдання у процесі роботи, що дозволяє створювати тісні цикли ітерацій. За замовчанням цей ШІ орієнтований на легкі, цілеспрямовані правки та не вдається до радикальних змін. Модель також не запускає тестування в автоматичному режимі. 

OpenAI вдалось прискорити обробку протягом усього процесу запит-відповідь. Накладні витрати на обмін даними між клієнтом та сервером скоротились на 80%. Витрати на кожен токен скоротились на 30%. Час отримання першого токена скоротився на 50% завдяки оптимізації ініціалізації сесії та потокової передачі даних. Інтеграція постійного з’єднання WebSocket також прискорила відгук, оскільки зникла необхідність постійно переузгоджувати з’єднання. 

Спецпроєкти12 технологічних подарунків для геймера до Дня закоханихПотужність 19 000 Па і точне миття вздовж країв: як Dreame L40 Ultra AE прибирає у найскладніших місцях

На які проблеми можна очікувати при роботі з GPT-5.3-Codex-Spark

В OpenAI попереджають, що за великої кількості запитів можна зіткнутись із затримками у доступі або тимчасовими чергами, оскільки компанія балансує надійність для всіх користувачів. Швидкість залишатиметься високою тільки якщо велика кількість людей не захоче використовувати швидкий доступ.

“У двох тестах SWE-Bench Pro і Terminal-Bench 2.0, що оцінюють можливості агентної розробки програмного забезпечення, GPT-5.3-Codex-Spark показує гірші результати, ніж GPT-5.3-Codex, але може виконати завдання за значно коротший час”, — не приховує розробник. 

Компанія також визнає, що GPT-5.3-Codex-Spark навряд чи досягне порогового значення високої ефективності в галузі кібербезпеки. Цей означає, що ця не найрозумніша модель ШІ від OpenAI робитиме помилки та робитиме це з великою швидкістю, створюючи менш захищений код. 

Ми писали, що OpenAI запустила застосунок для програмування Codex на macOS: безплатно і з лімітами 2x. Восени минулого року OpenAI представила GPT-5-Codex-Mini — ефективнішу модель для вайб-кодингу.

OpenAI може залишитися без коштів уже до середини 2027 року, — аналітики

Джерело: Techcrunch; ZDNet

Схожі публікації
Залишити відповідь