Обновить

Дезагрегированный инференс LLM в Kubernetes: префилл, декодирование и планирование подов

Уровень сложностиСредний
Время на прочтение20 мин
Охват и читатели7.3K
Всего голосов 4: ↑4 и ↓0+4
Комментарии0

Комментарии

Здесь пока нет ни одного комментария, вы можете стать первым!
Зарегистрируйтесь на Хабре, чтобы оставить комментарий

Информация

Сайт
tech.vk.com
Дата регистрации
Численность
1 001–5 000 человек
Местоположение
Россия
Представитель
Евгений Левашов