Trip-Hope8 апр в 14:34

Как мы научили AI-агента пользоваться IDE: дебаг, рефакторинг и run-конфигурации. Что нового в Veai 5.8

4 мин

14K

Блог компании VeaiJava * Искусственный интеллектМашинное обучение * Программирование *

✏️ Технотекст 8

+15

Комментарии 21

Wesha 8 апр в 15:12

Как мы научили AI-агента пользоваться IDE: дебаг, рефакторинг и run-конфигурации.

jegornet:
Нейросеть за час справляется с тем, на что у команды синьоров уходят годы – превратить новый проект в неподдерживаемое легаси-говно.

Dron007 8 апр в 18:08

Пока что-то вот наоборот - в проектах, поддерживаемых самыми топовыми профессионалами, ИИ обнаруживает огромные дыры. Но люди ещё веруют в свои сверхспособности, как Каспаров верил, что шахматы машинам недоступны.

Wesha 8 апр в 20:09

Ну и как, доступны?

«Если игральные кубики подбросить 100500 раз, то один раз таки выпадет шесть шестёрок» ©

Sinclear 10 апр в 06:15

Ага, вот тебе 5 кубиков)

dibu28 10 апр в 07:44

Шестой сделай сам)

DamirMur 9 апр в 14:14

Ну как находят. Знают что такая-то библиотека однозначно дырявая, вот и ищут её вхождение во все проекты. Отсюда гигантские цифры.

Dron007 9 апр в 14:53

Вы бы вот это почитали, а то совсем не в тему:
https://habr.com/ru/news/1020854/
https://habr.com/ru/companies/kodik/articles/1020826/

PaulRock 13 апр в 07:05

Это разные вещи: дать ии писать крупный проект и что бы он не превращался в легаси Г., и сканиравровать проект на уязвимости при помощи ии или другого инструмента, или для анализа и рефакторинга.

Шахматы доступны т.к. есть конечные вариант всех комбинаций ходов. Где то читал, что с игрой Го не все так просто для машин)

Columpio 9 апр в 11:32

Вот именно поэтому тут и добавили рефакторинг и дебаг инструменты: ИИ всё равно будет трогать ваш код, а так сломает меньше, чем могла бы

MountainGoat 8 апр в 17:11

Все мои попытки заставить ИИ найти и решить проблему в один запрос приводят к эффекту обезъяньей лапки. То есть решает, но таким способом, что нахрен такое счастье. Например, если какой-то кусок кода не работает, ИИ может просто написать новый, чтобы не чинить. А старый обычно оставит.

Как всегда, в несколько шагов, с подтверждением от пользователя, всё работает отлично.

amazingname 9 апр в 06:48

Это модели сонет и опус 4.6? Как раз пишу довольно сложную логику но такого давно не видел.

PaulRock 13 апр в 07:09

Проблема проблеме рознь. Например , если вы пишите сложную логику в одной функции, то ии хорошо справляется, но если у вас сложный и большой проект, то полагаясь в целом на ии вы получите лапшу из малопонятного кода и не рабочего.

В общем нужен контекст ваших задач, что бы были понятны ваши беды и печали)

DamirMur 9 апр в 14:20

Делюсь лайфхаком. Если кодовую базу проекта запихать в векторную базу, а потом использовать как mcp - сервер то 88% токенов сэкономите.

Columpio 9 апр в 19:30

Получал только полностью противоположные результаты с таким подходом: даже умные агенты превращались в генераторы мусора =)
Ждём от вас статью с объяснением, как это сделать, чтобы оно гарантировано работало!

DamirMur 10 апр в 00:52

Мне ИИ сделал такой проект, и написал статью, но habr.ru, статьи написанные ИИ не готов публиковать - их ответ.

Идея в том, чтобы отправлять платной модели не весь код, а подходящие небольшие куски кода и описания, на этом собственно и экономия.

1. Актуальность

1.1. Векторная база проекта создается, пересоздается и/или обновляется локально - экономия на эммбеддинге.
1.2.При обновлении модуля проекта переписываются/дополняются, необходимые описания архитектура проекта или описания только модуля проекта.

2. MCP-сервер должен выдавать актуальные куски кода (в количестве 5-10 штук), а не всю кодовую базу, с предыдущими нерабочими версиями.

3. Всякие рутинные операции, типа поиска и замены вхождений, отправки в репозиторий, создания каталогов и шаблонов файлов, запуска, актуализация RAG проекта для mcp-сервера - должна уметь выполнять локальная модель (самообучающаяся) - у неё своя база инструкций, в том числе, как пользоваться инструментами IDE.

headliner1985 11 апр в 00:40

таких проектов уже миллион, весь реддит ими забит, раз в неделю появляется кто-то с кодовой раг системой которая ну вот точно решит все проблемы) только толку от таких проектов пока что немного, проще перед задачей сказать LLM изучи как работает вот эта фича, запиши все в md файл, а в новом чате уже задавать задачу и подсунуть сгенеренный md файл с описанием фичи.

javadev 13 апр в 10:23

Круто!
Странно, что JetBrains не вынесла этот функционал в MCP сервер, и круто что вы его все равно реализовали

kavaynya 22 апр в 06:05

Вообще-то внесла rename_refactoring называется. И еще куча всего есть.
Смотрю на версии PhpStorm 2026.1. В предыдущей версии был совсем скудный набор. Но тот же клод у меня чего из этого не использует.

javadev 22 апр в 07:02

Я именно про функционал отладки. Rename - очень полезно, напрашивался прямо, но это не отладка

pikhting 17 апр в 05:54

Отличная работа! А вы эвалили результаты и, если да, то на каких бенчмарках? Любопытно, действительно ли эти тулы улучшают/ускоряют/удешевляют работу агента. И если получилось увидеть эффект, то какой в цифрах?

DaniilStepanov 17 апр в 14:50

У нас есть собственный бенчмарк, в котором обкатываем изменения в возможностях нашего агента, а также сравниваемся с claude code, opencode и т.д. Наличие инструментов в "среднем по больнице" значительно повышает эффективность (30%+), но сравнение не до конца честное, так как результат критически зависит от задачи, возможностей конкретного фреймворка и общего сетапа: mcp-тулов, AGENTS.md, скиллов и т.д. и т.п.

Зарегистрируйтесь на Хабре, чтобы оставить комментарий