Искусственный интеллект

AI, ANN и иные формы искусственного разума

2 549,99

Рейтинг

СтатьиПостыНовостиАвторыКомпании

TSjB 1 час назад

Как мы научили большую языковую модель говорить на карачаево-балкарском

Средний

11 мин

2.3K

Natural Language Processing * Искусственный интеллектМашинное обучение *

Кейс

Давно ничего не писал где-либо: разработка занимает много времени. Надеюсь, наш путь будет кому-либо полезен, особенно тем, кто обучает модельки на малоресурсных языках.

Большая в данном контексте - это условно. По сути, взяли Qwen3-4B-Instruct-2507 и обучили на карачаево-балкарском языке (тюркский, половецко-кыпчакская группа). По дороге пришлось написать собственный морфологический процессор для аугментации диалектов, обучить токенизатор с нуля, и найти баланс в обучении модели на сырых данных, чтобы она не забывала инструкций (а хотелось, чтобы могла отвечать).

Модель лежит на HuggingFace: TSjB/QM-4B. Работу представляли на конференции TurkLang 2026

AGmind 3 часа назад

DSpark на двух DGX Spark: порт, баг на одну строку и бенчмарки, которые пришлось мерить заново

Средний

20 мин

3.7K

Open source * Искусственный интеллектМашинное обучение *

DeepSeek выпустил DSpark — спекулятивный декодер для V4. В окне 27–30 июня 2026 рабочего публичного пути для GB10 не было — мы портировали его сами, нашли унаследованный баг, убивавший качество драфта, и сняли профиль своего стенда. Потом комьюнити выложило рецепт вдвое быстрее нашего. Мы его воспроизвели — и вместо гонки за цифрой сняли данные, которых в паблике не нашли: кривую деградации до реального 1M, механизм выигрыша NVFP4 и петли когерентности на глубине. Плюс три негативных результата.

sergei_ai 4 часа назад

Fable 5 из подвала, Sonnet 5 в дефолт. Что Antropic сделал за 5 дней

Средний

7 мин

4.4K

Искусственный интеллект

Мнение

Утро четверга, в шапке Claude Code «Sonnet 5» — а я не переключал. Полез разбираться, что Antropic успел за 5 дней. Вернули Файбл 5 после 19 дней в подвале и приложили cyber safeguards, jailbreak severity framework, HackerOne для баг-хантеров. Выкатили Sonnet 5 и поставили дефолтом на всех планах — Terminal-Bench 80.4% обгоняет опус 4.8, цена в 3 раза ниже. Плюс новый токенизатор, который аннулирует 30-40% заявленной экономии. Прогнал на своих задачах, разбираю что реально изменилось и куда переехал.

kliment_ceo 6 часов назад

Съездили к ByteDance и Z.ai: роботы по паспорту, серверные карты на рынке и восемь дней внутри китайского AI

Простой

13 мин

6.4K

Искусственный интеллектБудущее здесьМашинное обучение * ДизайнРобототехника

Репортаж

Прилетаем в Шанхай — в аэропорту встречают трое, помогают с чемоданами. По дороге выясняется: один из них — владелец компании, у которой данные покупают крупнейшие AI-лаборатории мира (OpenAI, Meta, Antropic и др.).

Так начались наши восемь дней внутри китайского AI: SiliconFlow, ByteDance (разработчики TikTok, Seedance), MiniMax, Z.ai (разработчики GLM) — встречи каждый день. Внутри статьи: что ByteDance выпускает 10 июля и почему флагманы дешевеют; как Z.ai уходят с NVIDIA на Huawei; рынок, где серверные видеокарты лежат рядом с айфонами; магазин, где гуманоидов продают по паспорту; и почему пекинские уборщики пока выигрывают у роботов.

Я — сооснователь GPTunneL, китайские модели покупаю и продаю каждый день. Рассказываю, как этот рынок выглядит вблизи.

Korridzy 7 часов назад

Гибель богов. Fable и ещё 10 LLM реорганизуют код. Сравнение

Сложный

31 мин

Проектирование и рефакторинг * Искусственный интеллектМашинное обучение * Python * Natural Language Processing *

Аналитика

Из песочницы

Это подробный разбор одного эксперимента. Я взял god node из реального LangGraph агента и попросил 5 американских и 6 китайских моделей сначала предложить, как её распутать, а потом оценить предложения друг друга. Дальше тремя разными способами пытался понять, кому из них в этом деле верить.

nihil-pro 8 часов назад

Галлюцинации: почему LLM «тупеют» от «умных» промптов

11 мин

Искусственный интеллектDIY или Сделай самOpen source * Программирование * Реверс-инжиниринг *

Как разработчик, я должен пользоваться ИИ на работе. Я бы, конечно, предпочел безлимитный Claude, но мне доступен только Qwen Code, а он часто галлюцинирует. В этой статье я расскажу, как искал причины галлюцинаций, устранял их и к чему это привело.

Первая моя задача для ИИ-помощника – CLI-агента, была простой, её можно было бы решить инструментом «найти и заменить» в IDE минут за 20, а агент трудился – часа два, что непозволительно много. Он постоянно галлюцинировал, добавлял ненужные артефакты, а я продолжал попытки направить его в нужное русло уже из спортивного интереса. Только после этого замечательного опыта я наконец решил «прочитать инструкцию»...

+12

askid 9 часов назад

Обзор изменений в новой версии Yttri

Простой

6 мин

Rust * Управление проектами * Управление разработкой * Машинное обучение * Искусственный интеллект

Обзор

0.86.0-beta.1 - это большой бета-цикл: агент получил единый дом в интерфейсе, у Yttri появился первый плагин (интеграция с Obsidian) и сама платформа плагинов, на Mac с Apple Silicon заработал альтернативный локальный движок MLX, а голосовой ввод и запись прошли через плотную серию фиксов стабильности. Ниже - по разделам, что из этого видно пользователю.

-2

VitTurov 9 часов назад

Промпт против скилла: прогнал библиотеку промптов Anthropic и скилл grill-me

Средний

19 мин

4.7K

Искусственный интеллектPython * Программирование *

Кейс

Пять промптов, один злой скилл и парсер Хабра: полевой отчёт не-разработчика о двух часах в Claude Code

nedovyazhu 10 часов назад

Давайте поговорим о доверии и границах

Простой

5 мин

4.8K

Информационная безопасность * Искусственный интеллектSmalltalk * Управление разработкой * Учебный процесс в IT

Обзор

Я женщина, поэтому даже в технической области я спокойно могу говорить на эти темы. (надеюсь в комментариях не обозлятся за это высказывание).

Ответьте себе на вопрос: где проходит ваша граница доверия с вашим агентом? Что вы готовы ему простить? А что для вас жесткий ред-флаг?

Готовы ли вы делегировать агенту задачу, в которой вы не разбираетесь, и взять за это ответственность, если что-то пойдет не так? А если наоборот, все будет очень хорошо — искренне признать, что по факту это не совсем ваш труд?

Это в целом философские вопросы, о которых можно спорить бесконечно, и ответ у каждого разный, и я доверяла и иногда до сих пор продолжаю доверять и осознанно иду на риск, потому что живем один раз, правильно?

У меня есть несколько смешных кейсов, которые я вам сейчас расскажу, но смеяться вы скорее всего не будете.

MrsWallbreaker 10 часов назад

Куда податься на финансирование по AI safety летом-осенью 2026: карта грантов, фондов и программ

Простой

6 мин

4.7K

Искусственный интеллектМашинное обучение * Научно-популярноеКарьера в IT-индустрииIT-эмиграция

Дайджест

Собрала эту карту для себя, пока разбиралась, куда податься на финансирование и в программы по AI safety. Делюсь. Ссылки и содержимое сверены по официальным страницам 3 июля 2026. Все меняется - проверяйте статус, сумму и дедлайн перед подачей.

-2

Alekseybv 11 часов назад

Как я добавил MAX в китайский AI-мост и запустил Claude прямо в мессенджере

Средний

2 мин

3.7K

Open source * Go * Искусственный интеллектПроектирование API *

Кейс

Из песочницы

Я хотел использовать Claude прямо в мессенджере MAX — без браузера, без переключения контекста. Готового решения не было. Нашёл на GitHub китайский проект cc-connect — Go-фреймворк с plugin-архитектурой для подключения AI-агентов к мессенджерам. Telegram, Feishu, Discord там были. MAX — нет.

Написал адаптер, открыл PR. Приняли. Теперь поддержка MAX — часть основного репозитория.

Что такое cc-connect

cc-connect — Go-фреймворк с чёткой трёхслойной архитектурой:

vaalimusic 21 час назад

Mix Hub в свой VST3-плагин: анализ конфликтов между дорожками

Средний

8 мин

11K

C++ * ЗвукOpen source * Искусственный интеллектWindows *

Кейс

Привет, Хабр! Меня зовут Артур Валиев. Я продолжаю делать свой VST3-плагин Mix Teacher AI.

В прошлый раз я рассказывал про идею плагина: поставить его на дорожку, посмотреть уровни, пики, RMS, примерный LUFS, частотные зоны и получить простую подсказку человеческим языком.

Но довольно быстро стало понятно, что анализировать только одну дорожку мало.

Потому что в сведении часто проблема не в одной дорожке.

Кик сам по себе нормальный.
Бас сам по себе нормальный.
Вокал сам по себе нормальный.
Барабаны вроде тоже нормальные.

А вместе всё почему-то не звучит.

И вот тут начинается самая интересная часть: конфликты между дорожками.

AGmind вчера в 18:53

Как я обучил русский RAG‑сплиттер, который режет документы по индексам, а не по тексту

Средний

22 мин

13K

Машинное обучение * Natural Language Processing * Open source * Искусственный интеллект

TL;DR. Из интереса обучил собственный русский RAG‑сплиттер — захотелось проверить, можно ли сделать context‑aware‑нарезку русских документов лучше готовых чанкеров.

Я взял идею датской context-aware-splitter, пересобрал её под русский на базе T-lite-it-2.1 и изменил главное: модель возвращает индексы границ, а не переписанный текст. Хост потом режет оригинал по этим индексам.

У index‑output оказалось три практических плюса:

+11

varvaratikh вчера в 17:36

GitHub стал однообразнее после появления ChatGPT?

Средний

11 мин

9.6K

Open source * GitHub * Искусственный интеллектBig Data *

Аналитика

После появления ChatGPT и массового распространения GitHub Copilot, Cursor, Claude Code, Windsurf и других AI-инструментов разработка стала заметно быстрее. Код, тесты, README, комментарии и небольшие utility-функции теперь можно получить за секунды.

Но вместе с этим появился менее очевидный вопрос: если миллионы разработчиков используют похожие модели и похожие промпты, не становится ли открытый код более однообразным?

В этой статье я проверяю эту гипотезу на данных GitHub за 2019-2025 годы: через GH Archive, BigQuery, commit messages, README, имена функций и собственный GitHub Uniformity Index.

К исследованию

asaptf вчера в 16:52

Переоценённый король

Средний

25 мин

9.2K

Python * Swift * Машинное обучение * Искусственный интеллект

Мнение

Из песочницы

Самая вычислительно прожорливая индустрия в истории считает на языке, который медленнее C примерно в 70 раз и занял 26-е место из 27 по энергоэффективности. Разбираемся, как Python стал королём ИИ, во сколько обходится его корона — в микросекундах, гигаватт-часах и удвоенном труде инженеров, — и почему новые территории (on-device, edge, локальный инференс) уже отвоёвывают компилируемые языки, в первую очередь Swift. С цифрами, ссылками на первоисточники и разбором честных контраргументов.

+11

Lancet52 вчера в 16:16

Оптимизация потребления памяти в ML-библиотеке LANCETNIC

4 мин

7.7K

Искусственный интеллектМашинное обучение * Python *

Туториал

Оптимизация потребления памяти в ML-библиотеке LANCETNIC

Недавно я столкнулся с проблемой: моя библиотека lancetnic при обучении на больших текстовых датасетах просто перегружала оперативную память. На ноутбуке с 16 ГБ RAM модель не могла обучиться даже на 25 тыс. строк. Я начал разбираться и нашёл пару причин критического перерасхода памяти.

timonin вчера в 16:07

Ваш ИИ‑агент ведёт на вас досье. Я превратил его в RPG‑лист персонажа

Простой

15 мин

7.9K

Искусственный интеллектOpen source * Python * Машинное обучение *

Кейс

Привет! Началось всё с дурацкого вопроса. Я который месяц живу в Claude Code — ставлю задачи, ругаюсь, прошу переделать, снова ругаюсь. И тут до меня дошло: каждая моя реплика лежит на диске. Вообще каждая. Каждое «сделай», каждое «проверь», каждый капс в три часа ночи — всё это тихо копится в JSONL‑файлах в домашней папке. У меня таких логов набралось на 200 тысяч слов за полтора месяца. Это, на минуточку, две «Мастер и Маргариты».

И вот сижу я, смотрю на эту гору данных и думаю — а как я вообще выгляжу со стороны машины? Не «хороший я или плохой», а буквально: какими словами командую, в котором часу наиболее опасен, сколько раз прервал модель на полуслове. Досье же готовое. Осталось его вскрыть.

Так за сутки диалога родился Prompt Warrior — опенсорсный скилл для Claude Code и других харнесов, который превращает локальные логи сессий в геймифицированный психологический портрет: титул, уровень, 74 ачивки с редкостями как в Стиме, шесть шкал характера и биография, которую пишет сама нейросеть.

fikstt2 вчера в 12:13

Как я хакнул рынок труда: пишем свой ИИ-комбайн для автооткликов на HH.ru

Простой

5 мин

7.8K

Python * Искусственный интеллектКарьера в IT-индустрииВеб-разработка * Open source *

Кейс

Всем привет! Если вы хоть раз искали работу в IT за последний год, то знаете, что рынок беспощаден к новичкам. Нужно откликнуться на сотни вакансий, а в итоге получаешь отказы от роботов. Чтобы пробиться через фильтры HR, нужно под каждую вакансию писать уникальное сопроводительное письмо.

В этой статье я сделаю полный разбор того, как я написал собственного автономного ИИ-агента, который ищет вакансии, фильтрует мусор с помощью локальной нейросети, пишет персонализированные сопроводительные письма и отчитывается мне в Telegram, пока я спокойно занимаюсь своими делами.

Я хотел, чтобы скрипт был бесплатным, автономным и не требовал танцев с бубном вокруг платных API.

ArtemErykov вчера в 11:55

Бесплатная защита от спама на почте с помощью ИИ фильтрации без VPN: многоуровневый метод с BERT и 550 МБ RAM

Средний

7 мин

7.7K

Серверное администрирование * Python * Машинное обучение * Спам и антиспамИскусственный интеллект

Кейс

Вас тоже достаёт спам и реклама? Рекламу я блокирую через свой DNS сервер и локальными CSS фильтрами, а вот для почты пришлось придумать что-то другое.

Схема многоступенчатая. Первыми срабатывают фильтры Яндекса и Mail — что-то они отсеивают сами, ещё до пересылки. То, что прошло через них, падает на мой сервер, где стоит SpamAssassin. Ловит ещё часть. Но после двух уровней всё равно что-то просачивается, спамеры же не сидят без дела. И вот этот остаток доезжает до Gmail и что-то оседает в папке Спам, а что-то попадает во входящие и приходит раздражающее уведомление. Хотелось, чтобы со временем не накапливался мусор в папках, который надо разгребать вручную. Особенно важно заблокировать то, что не является полностью спамом: приглашения на конференции, партнёрские предложения, кредиты — формально не нарушение, поэтому байесовский фильтр такие вещи плохо ловит.

Локальная BERT-модель закрыла обе проблемы. Взял ruBert-base-antispam с HuggingFace — файн-тюн на базе DeepPavlov/rubert-base-cased-conversational. 177 миллионов параметров, 12 слоёв трансформера, 768 hidden size. Физически не принимает больше 512 токенов на вход. В памяти занимает около 550 МБ, ответ приходит за 100-200 миллисекунд. Бинарный классификатор — текст на входе, 0 или 1 на выходе, никаких промптов и reasoning. Идеально!

achekalin вчера в 10:31

Palantir и голые токены: как продать «суверенный ИИ» людям, которые не любят терять контроль

10 мин

7.7K

Системное администрирование * Серверное администрирование * Искусственный интеллектУправление продажами * Big Data *

Обзор

Palantir выложил в X пост, который журналисты быстро стали называть «манифестом». Формально это «The Technological Republic, in brief» — промо-выжимка из книги Алекса Карпа и Николаса Замиски The Technological Republic. Если перевести с языка подрядчика для армии, разведки и крупного бизнеса на обычный русский: не отдавайте свои данные поставщикам больших языковых моделей, не считайте внедрение ИИ по расходу токенов, держите у себя модели, следы работы системы и результаты дообучения.

Но важно, кто именно это говорит. Palantir вырос не из кружка любителей открытого ПО - компания продаёт софт для соединения данных, прав доступа, предметных моделей и действий оператора; сама она описывает свой рынок как решения «from the factory floors to the front lines». По годовому отчёту за 2025 год, 54% выручки Palantir пришло от государственных заказчиков, 46% — от коммерческих. Это не декоративный раздел "прочие красивые кейсы", а почти половина бизнеса.

Поэтому, когда такая компания заводит речь про «экономию на токенах», речь не о бережливости. Речь о новом слое контроля: где живут данные, кто управляет моделью, кто видит запросы, кто получает следы работы системы и кто потом становится обязательной частью всей этой конструкции.

Игра по-крупному

2 3 ...

728 729