Обновить

Как превратить ChatGPT.com в Codex (но без лимитов)

Уровень сложностиПростой
Время на прочтение3 мин
Охват и читатели24K
Всего голосов 13: ↑9 и ↓4+8
Комментарии22

Комментарии 22

воистину вступаем в новую эру сосуществования с ИИ

я пробовал кодить и через GPT, и через Codex. с кодексом удобнее в том плане, что он сразу правит код, можно подключить git, управлять резервными копиями и откатывать состояние в случае непредвиденных

но в плане увеличения продуктивности однозначно стоит попробовать, спасибо!

Ну и жесть, это же не будет нормально адекватно работать. Кодекс делает десятки действий, спавнит субагентов, умеет напрямую запускать и тестировать код, там специальный промпт, специальный тул для редактирования кода...

Я уже больше 2 года использую(незадолго до появление codex написал), работает даже лучше(менеджмент памяти лучше сделан у chatgpt.com чем у codex). Вот типичный пример чата https://chatgpt.com/share/6a403c78-43bc-83eb-8a7e-ee0a3b176894

Кстати вот промтп кодекса если вам интересно он не секретный. https://t.me/bezrabotnyi/1249

работает даже лучше

Ну ок.)

Claude это не Codex =)

1) У кодекса есть auto compaction, которого вроде нет в ChatGPT

2) Дело не в промпте кодекса, дело в промпте самого ChatGPT, который никуда не девается и портит работу

3) Всё равно нет сабагентов

Я бы понял если бы это было бы для того чтоб получить pro версию gpt в режиме агента, ибо её нет в кодексе. А посыл "как поиграться с агентами, но с лимитами будто вы богатый" выглядит, как минимум, несерьёзно, рано или поздно лавку прикроют и в любом случае качества работы кодекса так не получается, какой-то самообман.

Да и в целом, инференс так-то не бесплатный, вот эти все лазейки лично у меня оставляют очень дурной привкус. Лимиты и так довольно большие, там идет огромная субсидизация по сравнению с просто API, поверх этого заниматься вот этой фигнёй всей...

Auto-compaction в Codex — это баг, а не фича. Любой кто строил приложения на llm удивиться насколько тупое решение просто суммаризировать все при заполнение окна и выкинуть последние 20% разговора.

Контекст забился логами/диффами/выводом команд → всё схлопнулось в короткую выжимку → часть состояния потерялась → Codex снова тратит токены на чтение файлов, git diff, тесты и восстановление картины проекта.

В ChatGPT.com мне больше нравится подход с обычным контекстом + памятью + reference chat history/RAG-подобным подтягиванием прошлых чатов. Это не бесконечная память, но деградация мягче: нет такого резкого момента, где систему “обнулило”, а потом она заново пытается понять, что вообще происходило.

Боже, вам нельзя писать статьи если вы вообще не понимаете в теме и с такой уверенностью пишете бред. Я не просто строю приложения, но и писал свой harness, сам тюнил ллм, делал self evolution для промптов/скиллов, настраивал оркестрации сабагентов. Compaction это стандарт индустрии.

1) Это именно что фича, по другому нельзя сделать если вы работаете над какой-то функциональностью в репозитории, контекст забивается и с этим ничего не сделать. Сжатие контекста есть во всех agentic coding harness, без этого невозможно работать над большими проектами.

2) Специфически по кодексу, openAI единственные у кого сжатие контекста работает не так, у ребят сделан специальный эндпоинт в v1/responses через который они сохраняют сжатое векторное представление контекста, чего нет ни у каких других вендоров, они про это делали блог

3) Сабагенты, которых у вас нет, позволяют решать эту проблему, ибо часть с процессом exploration/review выносятся из контекста основного треда.

Rag подтягивание прошлых чатов - для этого агент может читать git history, если нужен журнал - кодекс может вести журнал тоже.

Ещё раз, не пишите бред и не вводите людей в заблуждение, а то потом люди это тестируют и думают что фиговая работа агентов это норма, в по факту они используют какие-то непонятные лайфхаки типо вот этого. Для нормальной работы агентов вам нужен compaction, у меня вот сейчас codex без проблем работает уже 12 часов подряд, именно за счёт всей работы команды разработчиков которые писали приложение. Даже если не делать супер-длинные запуски, на любой большой фиче в большом репо у вас не уместится решение задачи без одного-двух сжатий контекста, ваш подход не скейлится на реальные задачи разработки.

Про «не бесплатный». Чтобы custom gpt сделать нужна подписка.

Про «субсидии» — это вообще странная мифология. Кто именно субсидирует одновременно OpenAI, Anthropic, Google, xAI, Z.AI, Qwen, Cursor и всех остальных? Тайный мировой фонд добрых инференсов? 🙂

Все сейчас сделали подписки от 3 до 20 раз дешевле, чем API. Не потому что добрые корпы занимаются благотворительностью, а потому что подписка продаёт управляемый доступ без жёсткой гарантии токенов(ни Claude/Codex/Z.AI/Qwen), а API продаёт потокеновый programmable access. Например, при пиковой нагрузке(для китайских ИИ 9:00-13:00 по москве) в 3 раза больше лимитов съедают

Не делаю SaaS на чужой подписке. Просто интерактивно работаю с ИИ. Это ровно тот сценарий, для которого продаются ChatGPT/Codex/Claude Code/Z.AI-подписки.

А tool call такой же текст по стоимости инференса. Просто где-то его парсит и исполняют, а где-то нет. Поэтому я уже сделал следующие расширение чтобы вызывать MCP для любых web llm типа Алиса/DeepSeek/... .

Про «субсидии» — это вообще странная мифология.

Сколько там заплатили за переманивание топ ребят по LLM? Сколько стоит построить Colossus? R&D + само обучение модели 5t -> 10t? Чуток очередь на чипы там. Торговля за TPU у Google.

Мифология для людей, которые $20-200 не смогли найти на подписку и сделать свой harness + RAG + long-term graph memory или взять у тех, кто уже сделал?

Подписки это просто способ саморекламы, потому что пользоваться по API это дорого, и без подписок обычные смертные пользоваться не будут. Сами компании субсидизируют свои coding plans, делая подписки которые на грани окупаемости, чтоб люди начали пользоваться их продуктами, и потом уже покупали по полной цене API со стороны enterprise.

Лимиты в кодинг планах довольно честные, если вы сравните с тем, сколько инференса вы смогли бы получить развернув модель на ноде HGX и платя за аренду. Вы получите меньшее, в худшем случае сранимое число токенов чем вы можете выжать из кодекса/GLM coding plan и так далее, при этом вам не нужно думать про аптайм, простой ГПУ и так далее. Поверх этого ещё и выжимать максимум и абузить чаты для agentic coding, имхо, это свинство.

В целом не удивлён таким ушлым людям, ещё ситуация с midjourney когда бесплатных пользователей именно из РФ забанили ибо они абузили создание подписок отлично показала менталитет. Потом не удивляйтесь, что страна в говне, когда каждый второй использует вот такой подход по жизни.

Здорово, что такой проект есть, но читал я недавно где-то, что OpenAI про это лазейку уже знает и скоро прикроет путём мёрджа лимитов ChatGPT и Codex на одном аккаунте.

Грустно, конечно, но я уже сделал что GPTAdmin работает в любом чат LLM (Алиса/DeepSeek/Qwen/Гигачад/Z.ai/..) Но именно это расширение станет значительно менее полезным без обновления.

Совмещенные лимиты это причина почему claude считаю ужасным.

Вообще OpenAI сделали свой туннель к MCP в прошлом месяце, и теперь память не выключают при подключении MCP сервера + добавили многошаговость TODO List как у z.ai. Так что да, идут к унификации, но custom gpt пока не успели испортить (а вот в  Apps SDK by OpenAI - их система защиты жутко режет почти любую команду)

Почему просто не написать свою обвязку с блекджеком? Это не так сложно, как кажется.

Да всё уже написано, но есть же LLM, можно еще раз переизобрести колесо, потом еще статью на Хабр можно написать

Я тут за пару дней написал агентную обвязку на PHP. PHP - потому что предназначена для встраивания в существующие сайты/веб-сервисы для агентного управления. По этой же причине, не имеет зависимостей, докера, компосера - автономная папка с ИИ-агентом. Несмотря на минимализм имеет весь необходимый для обвязки набор: управление контекстом (авто-сжатие), system prompt, user prompt, AGENTS.MD, скиллы, вызовы инструментов, MCP, планировщик (доступный для изменения агентом) - для автономных циклов.

Разве у chatgpt нет лимитов на чат? Это может работать с gemini или как можно адаптировать?

В чате браузера же нет доступа к файлам?

Автоматизация веб чата запрещена правилами и политикой сервиса. Пользуйтесь для себя, но это не решение в массы - это может привести к блокировкам аккаунтов.

Это типа этого? https://github.com/rebel0789/codexpro Разверни мсп сервер на пк, дай все права и чат гпт не просто чат, а уже агент на минималках. Для лёгких вещей пойдет

Зарегистрируйтесь на Хабре, чтобы оставить комментарий

Публикации