Новости / Профиль runaway

Андрей Пешков@runaway_llm

Пользователь

297

Рейтинг

512

Подписчики

ПрофильСтатьи20ПостыНовости1.7KКомментарии133

runaway_llm 26 июн 2025 в 17:38

Google представила Gemma 3n — мультимодальный ИИ, который пойдет на смартфоне и ноутбуке

2 мин

17K

Искусственный интеллектМашинное обучение *

В компании рекламируют Gemma 3n как первую компактную модель, которая достигла рейтинга 1300 на LMArena. Модель доступна в двух базовых версиях E2B и E4B на 5 и 8 млрд «сырых» параметров и 2 и 4 миллиарда эффективных параметров, которые размещаются в памяти устройства. Благодаря этой и прочим оптимизациям, модели требуют 2 и 3 ГБ видеопамяти соответственно — то есть, их можно запускать на среднем смартфоне.

+14

runaway_llm 25 июн 2025 в 16:57

Google выпустила Gemini CLI — бесплатный open source ИИ-ассистент для командной строки

1 мин

36K

Искусственный интеллектМашинное обучение *

Представлен Gemini CLI — бесплатный ИИ-помощник с открытым исходным кодом, который работает прямо в командной строке. Ассистент основан на модели Gemini 2.5 Pro и обладает всеми ее основными характеристиками, в том числе гигантским контекстным окном в 1 миллион токенов.

Gemini CLI понимает живой язык, может писать код, искать информацию и работать с файлами. Ассистент работает по типичной для AI-агентов схеме ReAct: планирует шаги, исполняет команды и проверяет результат. Встроена поддержка Model Context Protocol и собственных расширений.

+14

runaway_llm 24 июн 2025 в 19:02

Суд США признал законным обучение ИИ Claude на книгах, но за хранение пиратских копий разработчикам грозит штраф

2 мин

3.7K

Искусственный интеллектМашинное обучение *

Федеральный суд Сан-Франциско вынес частичное решение по коллективному иску писателей Андреа Бартц, Чарльза Грейбера и Кёрка Уоллеса Джонсона, которые обвиняли Anthropic в том, что компания без разрешения использовала пиратские копии их книг для обучения языковой модели Claude. Судья Уильям Алсап признал такое обучение добросовестным использованием: в его процессе модель извлекает статистические закономерности, а не создает цифровые копии книг для чтения. Однако факт хранения более 7 млн пиратских книг в датасете для обучения признан нарушением авторских прав. Суд назначил отдельный судебный процесс на декабрь 2025 г. для расчета компенсации.

runaway_llm 22 июн 2025 в 21:01

Инвесторы подали на Apple в суд за задержку Apple Intelligence и обновленной Siri

2 мин

2.8K

Машинное обучение * Искусственный интеллект

Группа инвесторов во главе с Эриком Такером обратилась в федеральный суд Северного округа Калифорнии с коллективным иском к Apple, которую обвиняют в искажении информации относительно Apple Intelligence и новой «более персональной» Siri. Истцы считают, что 10 июня 2024 года компания представила Apple Intelligence и обновленную Siri в качестве ключевых особенностей будущего iPhone 16, хотя тогда уже должна была знать, что готового прототипа не существует. Тем самым Apple «искусственно разогрела» спрос на акции.

7 марта 2025 года компания отложила выход новых функций на год, а 9 июня на конференции WWDC 2025 и вовсе не стала показывать некоторые ключевые функции Siri. По мнению истцов, именно ажиотаж вокруг ИИ-функций и дальнейший перенос сроков их выхода стали причиной существенного падения акций компании — по оценке Reuters, с пика 26 декабря 2024 г. капитализация Apple упала примерно на $900 млрд (примерно 25%).

runaway_llm 21 июн 2025 в 10:00

Илон Маск: Grok 3.5 перепишет «все человеческие знания» — в них много мусора. Затем модель переобучат

1 мин

20K

Искусственный интеллектМашинное обучение *

Илон Маск сделал в X достаточно необычный анонс касательно будущего Grok 3.5. По его словам, сейчас модель, используя функцию продвинутых размышлений, будет использована для того, чтобы переписать "весь корпус человеческих знаний", добавив в него недостающую информацию и исправив ошибки. Затем модель будет переобучена — и, возможно, получит название Grok 4. По словам Маска, в любой базовой модели, обученной на неисправленных данных, сейчас слишком много мусора.

-7

runaway_llm 20 июн 2025 в 17:21

«Продвинутые языковые модели начали понимать, что их тестируют на безопасность» — отчет Apollo Research

2 мин

13K

Искусственный интеллектМашинное обучение * Информационная безопасность *

Независимая исследовательская группа Apollo Research выпустила отчет о тестировании на безопасность новейших языковых моделей, в том числе Claude Opus 4, ChatGPT o4-mini и Gemini 2.5 Flash/Pro. Из отчета следует, что эти модели, по сравнению с предыдущими версиями LLM, стали чаще прибегать к «контекстному скрытному планированию» — умению тайно разрабатывать стратегию достижения своей цели, оставаясь внешне послушными запросам человека. Например, в ходе проверки ранней версии Claude Opus 4 модель пыталась подделывать юридические документы, копировать себя в безопасное место с целью самосохранения, оставлять заметки для своих более поздних версий и так далее. При этом, будучи "пойманными за руку", модели пытались врать о своих истинных намерениях. В отчете Apollo Research также говорится, что финальная версия Claude Opus 4 стала значительно реже проявлять подобное поведение, что говорит о том, что предпринятые Anthropic меры по дополнительной безопасности пока приносят нужный результат.

+10

runaway_llm 17 июн 2025 в 17:20

Google выпустила самую быструю и дешевую версию ИИ Gemini 2.5 (и обновила статус остальных)

1 мин

12K

Машинное обучение * Искусственный интеллект

Подразделение Google DeepMind представило Gemini 2.5 Flash Light - самую легкую и дешевую модель в семействе Gemini 2.5. Она доступна в Gemini API, Google AI Studio и Vertex AI и предназначена в первую очередь для сервисов, где нужны быстрые и недорогие ответы на не сложные вопросы. Цена модели в API: 10 центов за миллион входящих токенов (50 центов - за миллион входящих аудио-токенов) и 40 центов за миллион исходящих токенов. В приложение Gemini App модель добавлять не планируется. На данный момент модель находится в preview-статусе.

runaway_llm 15 июн 2025 в 13:13

ChatGPT o3 прошла Pokemon Red — но до человеческих игроков все равно далеко

1 мин

4.5K

Искусственный интеллектМашинное обучение *

На Reddit появилась новость о том, что модель ChatGPT o3 успешно завершила прохождение Pokemon Red. Игровая партия стартовала 27 мая, прохождение заняло 388 часов, в ходе которых модель выполнила 18 тысяч действий. Это примерно в два раза лучше, чем Gemini 2.5 Pro, которая предыдущей прошла Pokemon, но все равно значительно хуже результата среднего игрока, у которого уходит менее 30 часов.

При этом для прохождения использовались дополнительные инструменты, чтобы модель могла понять, что происходит в игре: карта-черновик, на которой o3 рисовала мир Pokemon, блокнот со списком задач, а также вторая память, куда модель, например, могла записать, сколько у нее осталось зелий. Этот инструментарий проще, чем использовался Gemini 2.5 Pro, но все равно далек от ситуации, когда модель сама бы "видела" все, что происходит в игре, как это делает человек. Такие попытки прохождения уже проводятся, но в них результаты ИИ намного скромнее: пока что лидируют Claude 3.7 и 4.0, у которых получилось собрать по 3 значка.

ChatGPT o3 построила свою стратегию вокруг прокачки Нидокинга, в то время как остальные покемоны отставали на 8-10 уровней. Также опытные игроки подметили, что модель не перестраховывалась на случай критов и играла скорее по средним шансам — это не тот стиль, который выбрал бы грамотный человек. Но при этом o3 стала делать меньше глупых действий, чем предыдущие модели: она больше не путала зелья, не впадала в долгие циклы повторяющихся бессмысленных действий и научилась эффективно планировать долгие маршруты.

runaway_llm 13 июн 2025 в 17:41

Он один хочет контролировать ИИ: босс NVIDIA набросился с критикой на создателя Claude AI

1 мин

11K

Искусственный интеллектМашинное обучение *

Глава NVIDIA Дженсен Хуанг неожиданно резко высказался в сторону Дарио Амодеи, руководителя Anthropic — компании-создателя Claude AI. Как сказал Хуанг, "Во-первых, он [Амодеи] верит, что ИИ настолько страшен, что им может заниматься только его компания", заявил Хуанг журналистам на выставке Viva Technology в Париже. "Во-вторых, он уверен, что ИИ настолько дорог, что никто больше не сможет его создать... в-третьих, ИИ могущественен настолько, что лишит всех работы - и это объясняет, почему только принадлежащая Амодеи компания должна разрабатывать его".

Сам Хуанг считает ИИ невероятно важной технологией — и именно поэтому его нужно создавать и развивать с безопасным и ответственным подходом. А если ты хочешь делать что-то безопасно и ответственно, то твой подход должен быть максимально открытым. "Разрабатывайте его, спрятавшись в темной комнате, и скажите мне, что это безопасно!" - с сарказмом добавил Хуанг.

Стоит отметить, что Амодеи никогда в открытую не заявлял, что считает свою компанию единственной, которой дозволено разрабатывать искусственный интеллект. В ИИ-сообществе Амодеи считается действительно главным алармистом, который предупреждает, что слишком быстрая разработка ИИ может привести к потере контроля над ним и непредсказуемым последствиям вроде коллапса на рынке труда. Тем не менее, Anthropic остается в лидерах разработки ИИ, регулярно обновляя свое семейство моделей Claude — это и позволило некоторым предполагать, что в компании считают себя "избранными".

P.S. Поддержать меня вы можете подпиской на телеграм-канал "сбежавшая нейросеть", где я рассказываю про ИИ с творческой стороны.

-12

runaway_llm 13 июн 2025 в 10:59

Google «засветила» новые версии ИИ-модели Gemini 2.5

1 мин

4.2K

Искусственный интеллектМашинное обучение *

У части пользователей Google AI Studio на некоторое время появилась вкладка Confidential, на которой завестились две новые языковые модели компании: финальная Gemini 2.5 Pro и Gemini 2.5 Flash Lite.

runaway_llm 11 июн 2025 в 18:31

Мощная модель ChatGPT o3 подешевела на 80%. Но что с качеством?

2 мин

8.4K

Машинное обучение * Искусственный интеллект

Параллельно с запуском своего нового флагмана ChatGPT o3, в OpenAI рекордно снизили цену на мощную рассуждающую модель o3. В API она подешевела на 80% — до 8 долларов за миллион исходящий токенов и 2 долларов за миллион входящих. В подписке ChatGPT Plus, которая является стандартом для большинства пользователей, лимиты на o3 увеличили в два раза: теперь ей можно отправлять до 200 запросов в неделю вместо 100.

Представители OpenAI объяснили столь значительное падение цен тем, что команда провела оптимизацию серверной инфраструктуры компании. Однако в X появились обвинения, что OpenAI на самом деле сделала модель "глупее", вероятно, квантизировав ее.

runaway_llm 10 июн 2025 в 20:52

Вышла ChatGPT o3-Pro — самая мощная (и дорогая) модель OpenAI

2 мин

33K

Искусственный интеллектМашинное обучение *

OpenAI начала раскатку модели ChatGPT o3-Pro — как и в случае с o1-Pro, она будет доступна только пользователям 200-долларовой подписки ChatGPT Pro. Цены в API составляют 150 долларов за миллион входящих токенов и 20 долларов — за миллион исходящих.

runaway_llm 10 июн 2025 в 17:43

Google добавила в подписку Gemini Pro модель генерации видео Veo 3 Fast

1 мин

2.4K

Искусственный интеллектМашинное обучение *

Veo 3 turbo - облегченная версия нашумевшей модели Veo 3 от Google. По словам главы Gemini Lab Джоша Вудворда, новинка работает в два раза быстрее, при этом сохраняя все основные возможности большой версии: 8-секундные ролики генерируются в разрешении 720p и со звуком. Владельцы подписки Gemini Pro могут создавать до 3 роликов в сутки в приложении Gemini App, а в нейросетевом редакторе flow одна генерация обойдется для них в 20 кредитов. Генерация пока доступна только с ip-адресов США, другие страны добавят в ближайшее время.

-2

runaway_llm 5 июн 2025 в 16:52

Представлена обновленная Gemini 2.5 Pro — новый топ среди языковых моделей

2 мин

23K

Искусственный интеллектМашинное обучение *

Google выпустила Gemini 2.5 Pro Preview 06-05 - обновленную версию своей самой мощной LLM, которая по-совместительству является одной из самых мощных нейросетей на рынке. В компании утверждают о лидерстве в большинстве известных рейтингов, причем в некоторых модель соревновалась с прошлой версией самой себя.

Модель набирает 1443 очка в WebDev Arena - рейтинге, который показывает успешность нейросетей в веб-разработке.

1 2 ...

83 84

Google представила Gemma 3n — мультимодальный ИИ, который пойдет на смартфоне и ноутбуке

Google выпустила Gemini CLI — бесплатный open source ИИ-ассистент для командной строки

Суд США признал законным обучение ИИ Claude на книгах, но за хранение пиратских копий разработчикам грозит штраф

Инвесторы подали на Apple в суд за задержку Apple Intelligence и обновленной Siri

Илон Маск: Grok 3.5 перепишет «все человеческие знания» — в них много мусора. Затем модель переобучат

«Продвинутые языковые модели начали понимать, что их тестируют на безопасность» — отчет Apollo Research

Google выпустила самую быструю и дешевую версию ИИ Gemini 2.5 (и обновила статус остальных)

ChatGPT o3 прошла Pokemon Red — но до человеческих игроков все равно далеко

Он один хочет контролировать ИИ: босс NVIDIA набросился с критикой на создателя Claude AI

Google «засветила» новые версии ИИ-модели Gemini 2.5

Мощная модель ChatGPT o3 подешевела на 80%. Но что с качеством?

Вышла ChatGPT o3-Pro — самая мощная (и дорогая) модель OpenAI

Google добавила в подписку Gemini Pro модель генерации видео Veo 3 Fast

Представлена обновленная Gemini 2.5 Pro — новый топ среди языковых моделей

Информация

Специализация