Комментарии 30
Хорошое использование ИИ. Если бы только токены не стояли, как крыло от боинга.
Уверен, это момент созревания индустрии. Лучшее предлагают за очень дорого, пока не появится что-то ещё лучше.
И это лучшее будут предлагать за очень-очень дорого.
А прошлое лучшее дешевле не станет, скорее просто исчезнет с рынка.
Напоминаю про опенсорс модели. Они не могут исчезнуть. Вообще никак.
Всегда есть альтернатива любым монополиям которые завысили цены и не предлагают за эту цену то-то реально уникальное.
Да, но для того, чтобы гонять локально хоть немного рабочую модель, способную нормально кодить, нужна видеокарта стоимостью от 3500 евро.
Можно купить мак с 36+ Гб оперативки - и на нем гонять. Я когда-то такой взял за 2.2к долларов. Да, не сильно быстро. Но быстрее, чем вручную.
Ее может запустить любой датацентр в мире. И дать вам в аренду за стоимость железа + небольшая прибыль. Прибыль выше небольшой невозможна, потому все датацентры в мире конкурируют за вас. Конкурировать можно только ценой.
Не нужна вам лично видеокарта, это серверное железо.
Интересно, сколько будет стоить аренда сервера с такой видеокартой в месяц? Дороже подписки Антропика, наверное?
На десятичные порядки дороже. Антропик демпингует страшно сейчас.
Как раз наличие таких открытых моделей не позволяет Антропику поднять цены х100 на все со словами "а куда вы денетесь с подводной лодки?"
Ну Фабл резко поднять цены можно попробовать. Мол она заметно лучше, платите. Куда вам деваться? А вот уже на Опус не выйдет. Все резко сбегут на GLM. Если качество сравнимо зачем платить больше?
И это отлично балансирует и защищает рынок от любого произвола.
Вот я к этому и веду. Личный инференс, с качеством достаточным для написания адекватного кода, скорее недоступен.
А в чем проблема? Датацентров в мире море. В любых юрисдикция. Конкуренция понятная.
Выглядит так что личное железо не имеет смысла. Вы его не сможете нагрузить даже на 80 процентов и оно выйдет дороже аренды.
В цене же проблема. Мы ведь это обсудили.
Где проблема? Все доступно по цене железа даже в самом плохом случае. Завышать цены не сделав чего-то уникального не выйдет. Максимально возможный уровень цен на обычный сервис понятен и обоснован. Аренда железа доступна всем.
Где проблема то?
Давайте вспомним то, с чего вы начали:
Напоминаю про опенсорс модели. Они не могут исчезнуть. Вообще никак.
А я привёл к тому, что использовать опенсорсные модели на порядки дороже, чем оплачивать подписку того же Антропика.
И разница в ДОСТУПНОСТИ как раз и состоит в цене. Есть много людей, которым оплачивать 20-100 баксов в месяц нормально, но тысячу они уже не потянут.
Так в чём тогда ваш изначальный поинт?
Да, теоретически опенсорс-модели доступны. Но оплачивать сервер с терабайтом памяти для инференса на GLM 5.2 для многих просто невозможно.
Напомню продолжение
А прошлое лучшее дешевле не станет, скорее просто исчезнет с рынка.
Антропик может демпинговать пока у него деньги не кончатся.
А вот поднять цены на все на порядки он не может. И убрать с рынка все дешевое тоже он не может. Потому что опенсорс ограничивает цену сверху и дает гарантированную доступность.
Рынок в отличном балансе находится.
То есть Антропик держит цены на 20-100 баксов в месяц пока локальный инференс такого же качества стоит тысячу или две? Как-то странно. Почему бы ему не поднять цену до 500 или 800 хотя бы?
Потому что конкуренты тоже демпингуют. И OpenAI и Z.AI держат цены в районе сотни баксов плюс-минус. Если поднять цены все быстро к ним сбегут.
Сейчас время такое что все демпингуют. Радуйтесь и пользуйтесь пока за вас платят.
В корпоративных API тарифах это уже происходит. Платить Антропику за API по их тарифу смысла прямо очень мало. Z.AI API выгоднее со всех сторон при сравнимом качестве.
Вы перепутали начало с продолжением.
Стоимость железа таки будет падать. Себестоимость материалов для производства чипов невелика. Большая часть цены это RnD + маржа + бенефиты монополии. Через условные 15 лет чипы аналогичные текущим топам будут стоить копейки.
Стоимость не будет падать, так как ситуация заставляет ВСЕХ крупных игроков скупать ВСЁ доступное железо, чтобы оно не досталось конкурентам.
Через 15 лет будет "либо шах, либо ишак, либо я".
А пока получается что рабочая лошадка 3090 выпущенная 6 лет назад последние 4 года держится в цене около 1К на БУ рынке, и дешевеет только учитывая бешеную инфляцию.
Аналогов с 24Гб выпущено не было, учитывая ситуацию с памятью и долгосрочные контракты у вендоров, ИМХО их можно не ждать ещё как минимум года 2.
Но я бы в нынешнем мире не стал делать прогнозы даже на 2 года вперёд.
а точно как крыло от боинга? мне кажется, что 150$ — это вообще копейки за эту работу
del
Я так и не понял, это дорого или дешево?
Это очень дешево.
Сейчас на GiHub Copilot, где всё уже давно считается по ценам API, на Fable за реализацию одной фичи типа режима пониженого потребления в каком нибудь простенькоми дивайсе можно влететь на 100$ за полчаса.
Человека спасло только то, что проект SQLite включает всего несколько сотен файлов. Из них ключевых всего несколько.
Это же его и убъет. Потому что такие движки Fable на ходу может сгенерить.
По сравнению с расценками команды сеньоров - это сущие копейки.
По сравнению с ценами на опенсорсные модели - очень дорого, но они пока что не тянут такое качество работы.

Соавтор Django рассказал, как Claude Fable 5 подготовил релиз sqlite-utils за $149