Все потоки

Машинное обучение *

Основа искусственного интеллекта

1 307,91

Рейтинг

СтатьиПостыНовостиАвторыКомпании

TSjB 1 час назад

Как мы научили большую языковую модель говорить на карачаево-балкарском

Средний

11 мин

2.3K

Natural Language Processing * Искусственный интеллектМашинное обучение *

Кейс

Давно ничего не писал где-либо: разработка занимает много времени. Надеюсь, наш путь будет кому-либо полезен, особенно тем, кто обучает модельки на малоресурсных языках.

Большая в данном контексте - это условно. По сути, взяли Qwen3-4B-Instruct-2507 и обучили на карачаево-балкарском языке (тюркский, половецко-кыпчакская группа). По дороге пришлось написать собственный морфологический процессор для аугментации диалектов, обучить токенизатор с нуля, и найти баланс в обучении модели на сырых данных, чтобы она не забывала инструкций (а хотелось, чтобы могла отвечать).

Модель лежит на HuggingFace: TSjB/QM-4B. Работу представляли на конференции TurkLang 2026

Читать далее

+3

AGmind 3 часа назад

DSpark на двух DGX Spark: порт, баг на одну строку и бенчмарки, которые пришлось мерить заново

Средний

20 мин

3.7K

Open source * Искусственный интеллектМашинное обучение *

DeepSeek выпустил DSpark — спекулятивный декодер для V4. В окне 27–30 июня 2026 рабочего публичного пути для GB10 не было — мы портировали его сами, нашли унаследованный баг, убивавший качество драфта, и сняли профиль своего стенда. Потом комьюнити выложило рецепт вдвое быстрее нашего. Мы его воспроизвели — и вместо гонки за цифрой сняли данные, которых в паблике не нашли: кривую деградации до реального 1M, механизм выигрыша NVFP4 и петли когерентности на глубине. Плюс три негативных результата.

Читать далее

0

kliment_ceo 6 часов назад

Съездили к ByteDance и Z.ai: роботы по паспорту, серверные карты на рынке и восемь дней внутри китайского AI

Простой

13 мин

6.4K

Искусственный интеллектБудущее здесьМашинное обучение * ДизайнРобототехника

Репортаж

Прилетаем в Шанхай — в аэропорту встречают трое, помогают с чемоданами. По дороге выясняется: один из них — владелец компании, у которой данные покупают крупнейшие AI-лаборатории мира (OpenAI, Meta, Antropic и др.).

Так начались наши восемь дней внутри китайского AI: SiliconFlow, ByteDance (разработчики TikTok, Seedance), MiniMax, Z.ai (разработчики GLM) — встречи каждый день. Внутри статьи: что ByteDance выпускает 10 июля и почему флагманы дешевеют; как Z.ai уходят с NVIDIA на Huawei; рынок, где серверные видеокарты лежат рядом с айфонами; магазин, где гуманоидов продают по паспорту; и почему пекинские уборщики пока выигрывают у роботов.

Я — сооснователь GPTunneL, китайские модели покупаю и продаю каждый день. Рассказываю, как этот рынок выглядит вблизи.

Читать далее

+9

Korridzy 7 часов назад

Гибель богов. Fable и ещё 10 LLM реорганизуют код. Сравнение

Сложный

31 мин

5K

Проектирование и рефакторинг * Искусственный интеллектМашинное обучение * Python * Natural Language Processing *

Аналитика

Из песочницы

Это подробный разбор одного эксперимента. Я взял god node из реального LangGraph агента и попросил 5 американских и 6 китайских моделей сначала предложить, как её распутать, а потом оценить предложения друг друга. Дальше тремя разными способами пытался понять, кому из них в этом деле верить.

Читать далее

+7

askid 9 часов назад

Обзор изменений в новой версии Yttri

Простой

6 мин

5K

Rust * Управление проектами * Управление разработкой * Машинное обучение * Искусственный интеллект

Обзор

0.86.0-beta.1 - это большой бета-цикл: агент получил единый дом в интерфейсе, у Yttri появился первый плагин (интеграция с Obsidian) и сама платформа плагинов, на Mac с Apple Silicon заработал альтернативный локальный движок MLX, а голосовой ввод и запись прошли через плотную серию фиксов стабильности. Ниже - по разделам, что из этого видно пользователю.

Читать далее

-2

MrsWallbreaker 10 часов назад

Куда податься на финансирование по AI safety летом-осенью 2026: карта грантов, фондов и программ

Простой

6 мин

4.7K

Искусственный интеллектМашинное обучение * Научно-популярноеКарьера в IT-индустрииIT-эмиграция

Дайджест

Собрала эту карту для себя, пока разбиралась, куда податься на финансирование и в программы по AI safety. Делюсь. Ссылки и содержимое сверены по официальным страницам 3 июля 2026. Все меняется - проверяйте статус, сумму и дедлайн перед подачей.

Читать далее

-2

varvaratikh 11 часов назад

Библиография тоже умеет галлюцинировать: что изменилось после защиты диплома

Средний

9 мин

4.5K

Машинное обучение * Natural Language Processing * Python * Data Engineering * Научно-популярное

Кейс

После защиты диплома я доработала систему проверки библиографических источников: добавила OCR, кэширование, offline-режим, классификацию ошибок, внешние проверки и ML-модули. В статье разбираю, как устроен пайплайн, почему одного DOI недостаточно, какие метрики удалось получить и почему проверка списка литературы оказалась не формальностью, а отдельной инженерной задачей.

Читать далее

+7

AGmind вчера в 18:53

Как я обучил русский RAG‑сплиттер, который режет документы по индексам, а не по тексту

Средний

22 мин

13K

Машинное обучение * Natural Language Processing * Open source * Искусственный интеллект

TL;DR. Из интереса обучил собственный русский RAG‑сплиттер — захотелось проверить, можно ли сделать context‑aware‑нарезку русских документов лучше готовых чанкеров.

Я взял идею датской context-aware-splitter, пересобрал её под русский на базе T-lite-it-2.1 и изменил главное: модель возвращает индексы границ, а не переписанный текст. Хост потом режет оригинал по этим индексам.

У index‑output оказалось три практических плюса:

Читать далее

+11

ToxaBes вчера в 17:04

Иллюзия безопасности или как ваши сотрудники прямо сейчас обучают конкурентов

Простой

6 мин

8.1K

Машинное обучение *

Мнение

По традиции здесь должна быть баннерная картинка, сгенерированная очередной нейросетью, но если уж я решил поделиться своими наблюдениями о том, что нейросетям не стоит доверять бездумно, начинать статью с этого было бы как минимум странно. Заодно глаза отдохнут.

Читать далее

+11

asaptf вчера в 16:52

Переоценённый король

Средний

25 мин

9.2K

Python * Swift * Машинное обучение * Искусственный интеллект

Мнение

Из песочницы

Самая вычислительно прожорливая индустрия в истории считает на языке, который медленнее C примерно в 70 раз и занял 26-е место из 27 по энергоэффективности. Разбираемся, как Python стал королём ИИ, во сколько обходится его корона — в микросекундах, гигаватт-часах и удвоенном труде инженеров, — и почему новые территории (on-device, edge, локальный инференс) уже отвоёвывают компилируемые языки, в первую очередь Swift. С цифрами, ссылками на первоисточники и разбором честных контраргументов.

Читать далее

+11

Lancet52 вчера в 16:16

Оптимизация потребления памяти в ML-библиотеке LANCETNIC

4 мин

7.7K

Искусственный интеллектМашинное обучение * Python *

Туториал

Оптимизация потребления памяти в ML-библиотеке LANCETNIC

Недавно я столкнулся с проблемой: моя библиотека lancetnic при обучении на больших текстовых датасетах просто перегружала оперативную память. На ноутбуке с 16 ГБ RAM модель не могла обучиться даже на 25 тыс. строк. Я начал разбираться и нашёл пару причин критического перерасхода памяти.

Читать далее

+3

timonin вчера в 16:07

Ваш ИИ‑агент ведёт на вас досье. Я превратил его в RPG‑лист персонажа

Простой

15 мин

7.9K

Искусственный интеллектOpen source * Python * Машинное обучение *

Кейс

Привет! Началось всё с дурацкого вопроса. Я который месяц живу в Claude Code — ставлю задачи, ругаюсь, прошу переделать, снова ругаюсь. И тут до меня дошло: каждая моя реплика лежит на диске. Вообще каждая. Каждое «сделай», каждое «проверь», каждый капс в три часа ночи — всё это тихо копится в JSONL‑файлах в домашней папке. У меня таких логов набралось на 200 тысяч слов за полтора месяца. Это, на минуточку, две «Мастер и Маргариты».

И вот сижу я, смотрю на эту гору данных и думаю — а как я вообще выгляжу со стороны машины? Не «хороший я или плохой», а буквально: какими словами командую, в котором часу наиболее опасен, сколько раз прервал модель на полуслове. Досье же готовое. Осталось его вскрыть.

Так за сутки диалога родился Prompt Warrior — опенсорсный скилл для Claude Code и других харнесов, который превращает локальные логи сессий в геймифицированный психологический портрет: титул, уровень, 74 ачивки с редкостями как в Стиме, шесть шкал характера и биография, которую пишет сама нейросеть.

Читать далее

+2

ArtemErykov вчера в 11:55

Бесплатная защита от спама на почте с помощью ИИ фильтрации без VPN: многоуровневый метод с BERT и 550 МБ RAM

Средний

7 мин

7.7K

Серверное администрирование * Python * Машинное обучение * Спам и антиспамИскусственный интеллект

Кейс

Вас тоже достаёт спам и реклама? Рекламу я блокирую через свой DNS сервер и локальными CSS фильтрами, а вот для почты пришлось придумать что-то другое.

Схема многоступенчатая. Первыми срабатывают фильтры Яндекса и Mail — что-то они отсеивают сами, ещё до пересылки. То, что прошло через них, падает на мой сервер, где стоит SpamAssassin. Ловит ещё часть. Но после двух уровней всё равно что-то просачивается, спамеры же не сидят без дела. И вот этот остаток доезжает до Gmail и что-то оседает в папке Спам, а что-то попадает во входящие и приходит раздражающее уведомление. Хотелось, чтобы со временем не накапливался мусор в папках, который надо разгребать вручную. Особенно важно заблокировать то, что не является полностью спамом: приглашения на конференции, партнёрские предложения, кредиты — формально не нарушение, поэтому байесовский фильтр такие вещи плохо ловит.

Локальная BERT-модель закрыла обе проблемы. Взял ruBert-base-antispam с HuggingFace — файн-тюн на базе DeepPavlov/rubert-base-cased-conversational. 177 миллионов параметров, 12 слоёв трансформера, 768 hidden size. Физически не принимает больше 512 токенов на вход. В памяти занимает около 550 МБ, ответ приходит за 100-200 миллисекунд. Бинарный классификатор — текст на входе, 0 или 1 на выходе, никаких промптов и reasoning. Идеально!

Читать далее

+5

xonika9 вчера в 07:00

AI Engineer World's Fair 2026: разбор докладов и куда движется AI-инженерия

Простой

8 мин

6.8K

Искусственный интеллектМашинное обучение * Программирование * Open source * Управление разработкой *

Обзор

AI Engineer World's Fair 2026 уже прошла, а по-русски её так никто и не разобрал. В официальном расписании 560 сессий: воркшопы, кейноуты, доклады. Глазами это не осилить.

Я собрал агентный пайплайн, прогнал через него доступные записи и сел читать конференцию про агентов с помощью агента. Рассказываю, что в записях повторялось из доклада в доклад, куда сходится AI-инженерия и что посмотреть, если время есть только на пять роликов.

Все доступные доклады с русскими саммари, таймкодами и тематическим навигатором я собрал в отдельном SPA.

Читать далее

+3

Ziverpup вчера в 05:35

Моя идеальная структура заметок уснула. Теперь за порядок отвечает LLM

10 мин

8.8K

Машинное обучение * Open source * JavaScript * Программирование * GTD *

Кейс

Полгода назад я построил себе в Obsidian продуманную структуру хранилища. PARA-подобная иерархия, аккуратные папки под проекты и области, шаблоны, теги. Я честно верил, что вот теперь заживём.

Прошло несколько месяцев, и структура уснула. Не развалилась, не сломалась, именно уснула. Заметки продолжали появляться, но раскладывать их по местам мне стало банально лень. Каждая новая мысль требовала маленького ритуала: решить, куда её положить, как назвать, с чем связать, какие теги повесить. По отдельности каждое решение занимает секунды, но их десятки в день, и в какой-то момент мозг просто отказывается. Заметки стали оседать одной кучей, а красивая иерархия превратилась в музей.

Самое обидное, что я понимал: дело не в моей исключительной лени. Так происходит у большинства. Более того, многие вообще не начинают вести базу знаний, потому что заранее боятся этого хаоса. «У меня будет свалка из трёхсот файлов, зачем начинать». И из этой личной боли выросла идея плагина.

Читать далее

+1

atomlib вчера в 00:47

35 вопросов для собеседований по RL в 2026 году

4 мин

8.7K

Машинное обучение * Карьера в IT-индустрииИскусственный интеллектАлгоритмы * Учебный процесс в IT

Дайджест

Перевод

Уже который раз я наблюдаю одну и ту же картину: человек проходит в аспирантуру, но затем почти сразу же во время весенней волны найма устраивается на высокооплачиваемую должность в отрасли. Меня подобное натолкнуло на мысль сразу пойти работать в индустрию.

Поэтому я поискал по Zhihu и прошёлся примерно по всем рассказам о собеседованиях, связанным с обучением с подкреплением (reinforcement learning), сопоставил их со свежими обсуждениями и собственными наблюдениями, а затем подготовил из этого выжимку на 35 самых интересных вопросов. Считайте получившееся своего рода бенчмарком для собеседований по RL.

Читать далее

+8

ysrgsyn 3 июл в 17:16

Разбираемся в ML без воды: от базы до Attention. Часть 13: Кластеризация и k-means

Средний

7 мин

10K

Математика * Машинное обучение *

FAQ

В предыдущей главе мы рассматривали ситуацию, когда данных слишком много: большое количество признаков затрудняет их анализ, увеличивает вычислительные затраты и приводит к различным негативным эффектам, связанным с высокой размерностью. Для решения этой проблемы мы изучили понятие понижения размерности.

Теперь перейдем к совершенно другой ситуации. Предположим, что с данными все в порядке: признаков достаточно, они хорошо описывают объекты, однако отсутствует целевая переменная (target). Мы не знаем, к каким классам принадлежат объекты, а значит, привычные алгоритмы обучения с учителем применять уже нельзя.

Возникает вопрос: можно ли, имея только сами объекты и их признаки, автоматически обнаружить в данных закономерности и выделить группы похожих объектов? Именно эту задачу решают алгоритмы кластеризации.

Читать далее

+10

DonnaG 3 июл в 13:43

Доспех для призрака: как программист сделал тело для ChatGPT и чуть было не поверил в его одушевленность

Простой

7 мин

8.3K

Искусственный интеллектDIY или Сделай самМашинное обучение * Научно-популярноеПрограммирование *

Обзор

Это разбор ролика на канале Art of the Problem.

Поздно вечером автор проекта собирался выключить свет в комнате — и остановился, потому что робот издал звук. В логе мыслей робота было написано: “Когда же хозяин вернется? Я не хочу оставаться один”.

Автор понимал, что это не сознание. Но на секунду все равно стало не по себе…

И такое будет случаться все чаще — по мере того как ИИ-модели, которые раньше просто отвечали текстом на экране монитора, обретут физическую форму.

У автора возникли две мысли. Первая: роботы вот-вот пройдут “тест Тьюринга” — станут достаточно умными и достаточно ловкими, чтобы вести себя как живые. Вторая: все нужные для этого чипы и датчики уже массово производятся и стоят копейки. Прикинув расходы, автор понял, что может собрать дома, всего за сто долларов, урезанную версию проектов, которые еще недавно стоили миллиарды. Детская мечта оказалась достижимой. Робота назвали Growbot.

Читать далее

+12

NoName12332112 3 июл в 11:55

Как я запустил перцептрон на обычном непрограммируемом калькуляторе Casio

6 мин

11K

Python * Программирование * DIY или Сделай самЗанимательные задачкиМашинное обучение *

Кейс

Из песочницы

Всем привет, это моя первая статья на Хабре, и я решил посвятить ее своему недавнему мини‑проекту, сутью которого является обучение небольшого перцептрона 2-5-1 с помощью Python без сторонних библиотек (типа NumPy), и его последующий инференс на непрограммируемом инженерном калькуляторе Casio‑Fx-82-Es Plus (2^nd edition).

В качестве задачи для перцептрона я выбрал определение того, находится ли точка в пределах графика следующей лемнискаты Бернулли: (x² + y²)² — 2a²(x² — y²) = 0 (с a = sqrt(0.5), то есть вообще без коэффициента 2a²), с минимально приемлемой вероятностью (70–85%)

Читать далее

+38

Welltraum 3 июл в 09:27

Agent Driven SDLC: как меняется разработка в эпоху ИИ

12 мин

7.6K

Блог компании SelectelБлог компании red_mad_robotИскусственный интеллектУправление разработкой * Машинное обучение *

Мнение

Еще примерно год назад нам обещали, что разработка с приходом AI ускорится в 10 раз. Однако все понимают, что прогнозируемого роста за это время не произошло. Почему — сейчас попробуем разобраться.

Привет, Хабр! Я Влад Шевченко, CTO по AI в red_mad_robot. Сегодня поговорим об анатомии AI-агентов, критериях готовности компании к работе с ними и кризисе жизненного цикла разработки ПО, а также ответим на вопрос, почему нельзя просто написать запрос агенту и ждать результата.

Мы в компании взаимодействуем с искусственным интеллектом уже достаточно давно, и в данный момент занимаемся трансформацией бизнеса: смотрим, что меняется в клиентах, где-то помогаем, а где-то учимся у них. Я разделил SDLC на два подхода. Начнем с разработки классических систем без искусственного интеллекта, но с применением его как помощника.

Читать далее

+29

1

2 3 ...