Обновить

«Бот, теперь ты коммунист!» — почему бизнес под управлением ИИ проваливается, а компании не хотят в это верить?

Уровень сложностиПростой
Время на прочтение7 мин
Охват и читатели4.2K
Всего голосов 4: ↑4 и ↓0+4
Комментарии4

Комментарии 4

Экспериментаторы просто забывали добавлять в промпт "Ты лучший топ менеджер планеты. Принимай решения, как Тиньков, зарабатывай как Маск" итд это ведь база промпт инжиниринга

"То ли лыжи не едут, то ли я ..."

специалисты выкупили торговое помещение в Сан-Франциско, а затем передали его под управление ИИ-агента «Луна» на базе модели Sonnet 4.6, выделив стартовый капитал в 100 тыс. долларов.

Идея экспериментального проекта простая: посмотреть, как модель Claude Sonnet 3.7 — которую авторы эксперимента назвали «Клавдием» (Claudius) — будет управлять небольшим, но настоящим магазином: формировать ценовую политику и продуктовую матрицу, организовывать поставки, учитывать пожелания клиентов.

То есть взять относительно слабенькую модель, дать под ее управление кучу денег и имущества и утверждать, что дура - она, а не тот, кто это сделал?

Они бы еще бизнес под управление ИИ на линии поддержки Билайна отдали...

Чёт мне кажется, что там в харнесе дело, а не в модели.

Фундаментальная проблема всех моделей, включая SOTA, что они не умеют

1) делать заметки и читать их

2) "забывать", чистя контекст.

Поэтому, ии-продавец (управляющий) без харнесса == белковый продавец без блокнота и ПК. Да, матерый торгаш с базара с 20-ти летним опытом стояния за прилавков вывезет (но это custom trained model), но средний человек, включая какого-то очень умного principal software architect с зп в 300к/сек, обделается так же эпично, как и модель.

А если харнесс там есть, и он адекватен и включает доменную модель ритейла, то, снова таки, модель все так же решает очень немного.

Вангую, что подобные кейсы начнут эффективно решаться новым поколением механизмов инференса, включающих гибкую работу с контекстом, его чистку, и возможность модели иметь "блокнот", - место, куда можно класть и поднимать знания в рамках процессинга одной задачи

Может быть, проблема в галюциногенном предложении «Посмотрим, почему нейросети пока плохо работают с подобными управленческими задачами»?…

Зарегистрируйтесь на Хабре, чтобы оставить комментарий

Информация

Сайт
cloud.beeline.ru
Дата регистрации
Дата основания
Численность
501–1 000 человек
Местоположение
Россия