OlegYushin1 июл в 07:35

Контекстная инженерия для слабой локальной модели: как мы делаем среднюю модель надёжной

5 мин

7.2K

Блог компании Первая ФормаIT-инфраструктура * Искусственный интеллектСофт

+19

Комментарии 6

Petroleum_man 1 июл в 10:48

У вас просто qa rag бот или умеет тулы вызывать и работать в агентском цикле?

OlegYushin 1 июл в 15:23

Не просто QA-RAG. Базовый режим — поиск по документации, но основное — агентский цикл. ИИ планирует, вызывает инструменты, смотрит на результат и решает следующий шаг. Мы реализовали самые свежие подходы, близкие к RLM и CodeAct

Petroleum_man 1 июл в 15:46

Интересны технические детали для маленькой модели. Если агент сам подтягивает контекст, то он может несколькими тул коллами забить себе контекст. Если делать compaction, то контекст в рамках одного хода рвётся. Как решали это?

OlegYushin 2 июл в 10:48

Мы эту проблему в основном обходим: контекст собирает не модель, а код, до вызова (раздел про предзагрузку). Простые вопросы закрываются за один проход по заранее подготовленному материалу, многоходовый режим включается только для сложных. Результаты инструментов в окно целиком не льются, идет только прошедшее порог и урезанное до нужного. Если контекст шага не влезает, это ошибка сборки, режем на этапе курации

Petroleum_man 2 июл в 14:31

Какие тулы есть у вашего агента?

Обычно все дают что то вроде grep, search files, web query

AlexeyChijov 1 июл в 13:21

Очень полезная информация, как формировать хороший контекст при запросах в LLM.

Зарегистрируйтесь на Хабре, чтобы оставить комментарий