
И тут очень вовремя OpenAI закрывают SoraНейротикток OpenAI в итоге не взлетел и не имел особых перспектив монетизации, так что компания решила сконцентироваться на более денежных направлениях.@ai_newz
@notedatascience
Работаю аналитиком в Яндексе, учусь NLP в Вышке и веду этот канал про применение Data Science в компаниях, новости индустрии, рынок труда, мероприятия и другие активности вокруг науки о данных Чат канала: t.me/notedatasciencechat Автор: @travelwithtagir

И тут очень вовремя OpenAI закрывают SoraНейротикток OpenAI в итоге не взлетел и не имел особых перспектив монетизации, так что компания решила сконцентироваться на более денежных направлениях.@ai_newz
OpenAI запускают серию соревнований, подготовленных членами их исследовательской командыСейчас открыли первый челлендж: https://openai.com/index/parameter-golf/Задача — обучить наилучшую языковую модель, которая помещается в 16 МБ и обучается менее чем за 10 минут на 8 H100. Оценка "наилучшести" — по сжатию отложенной части FineWeb, чем лучше модель предсказывает текст, тем лучше.Это очень похоже на NanoGPT спидран от Andrej Karpathy, только там нет ограничения на размер модели, и время не задано, а нужно оптимизировать.Во время соревнования OpenAI ожидает работу по большому количеству направлений — созданию уникальных архитектур (вычисления во время тестирования, агрессивная связка пар параметров, рекуррентность в глубину, обучение с низким рангом и т. д.), схем сжатия (низкая точность, QAT, битовые сети, новые токенизаторы и т. д.) и других креативных решений (обучение во время тестирования, длинный контекст и т. д.).И... участникам дают $1M кредитов на GPU! Можно попросить $25 — чтобы начать, $500 — чтобы протестировать набор идей, и $1000 — чтобы выбиться в топ. Просить кредиты можно несколько раз (в том числе и большие гранты).Соревнование закончится 30-го апреля, а в июне компания планирует нанять часть участников.

Gemini 3.1 Promodel cardОбновили нашу флагманскую модель, основной фокус в этом релизе на агентских способностях и кодинге, но и в общих способностях моделька подкачалась. Цена осталась такой же, как на 3 Pro.Поиграться, как обычно, можно на ai.dev
Вышел Kling 3.0!Если коротко: это уже не апдейт, а полноценная перезагрузка. Объединили Video 2.6 и O1 в единую модель под названием «All-in-One».Что нового из релиза:1) До 15 секунд за одну генерацию (было 10). Плюс теперь можно выбирать точную длину от 3 до 15, а не из пресетов.2) Multi-shot — до 6 склеек в одном видео. Типа «AI-режиссёр»: сам расставляет камеры, делает shot-reverse-shot для диалогов. Посмотрим, насколько это реально работает.3) Нативный звук: голоса персонажей, музыка, эмбиент — генерятся вместе с видео. Липсинк на 5 языках включая японский и корейский. 4) Elements 3.0 — можно залить референс персонажа (и даже голос), и он сохраняется между генерациями. 5) Точный текст в кадре — вывески, субтитры, рекламные макеты. Утверждают, что читаемый. ЭТО МЫ ТЕСТИМ (Ultra, на других тарифах должно быть вот-вот) 💳
Gemini знает о вас всёGoogle запустили Personal Intelligence, подключив Google Photos и YouTube в контекст Gemini.На вопрос "какие покрышки лучше купить?" Gemini мог бы просто найти фото вашей машины в галерее и подсказать необходимые параметры — это несложно. Но гугл пошли дальше: по другим снимкам, агента научили выяснять что вы часто ездите по глине на дачу, и тот предложит протекторы побольше.Главное здесь не просто доступ к фоткам, а то, что Gemini научили находить в них смысл и связи. Ведь Google Фото с его безграничным хранилищем, где могут лежать снимки за десятки лет, — контекст слишком большим для любой LLM. Кстати, теперь становится понятно, почему всё это время хранилище было бесплатным — они явно что-то знали. Ну или это просто блестящий пример интеграции новой технологии в существующую экосистему. Фича, кстати, по умолчанию выключена.Следующий этап очевиден — запись в шиномонтажку около дома по голосовому запросу.Раскатывают пока на US подписчиков. @ai_newz

🤖 GPT-5.1: что завезли в ChatGPTOpenAI выкатывает обновление линейки GPT-5 – теперь это GPT-5.1, с упором на более живое общение и нормальные настройки тона. Внутри две ветки: Instant и ThinkingGPT-5.1 Instant👀 По-умолчанию стала теплее и разговорнее👀 Лучше держит инструкции: если попросить «отвечать шестью словами», действительно продолжит в этом формате, а не сорвется через пару сообщений👀 Появился adaptive reasoning – модель сама решает, когда «подумать подольше» над сложным вопросом. За счёт этого подтянули математику и кодинг на задачах уровня AIME 2025 и CodeforcesGPT-5.1 Thinking👀 Точнее дозирует время размышления: на простых запросах отвечает заметно быстрее, на сложных – дольше и глубже. В выборке реальных задач самые быстрые ответы стали примерно в 2 раза быстрее, а самые долгие – в 2 раза медленнее, чем у GPT-5 Thinking👀 Ответы чище: меньше жаргона и непоясненных терминов, материал легче читать, особенно когда нужно объяснять техничку или сложные рабочие кейсы. Тон по умолчанию тоже сделали более эмпатичнымПерсонализацияВ настройках ChatGPT обновили личности. Остались Default/Friendly/Efficient, добавились Professional, Candid и Quirky, плюс старые Nerdy и CynicalТеперь можно отдельно крутить, насколько ответы будут краткими/теплыми и как часто модель будет сыпать эмодзи. ChatGPT умеет сам предлагать обновить эти настройки, если вы регулярно просите другой тон прямо в диалоге. Все эти параметры действуют для любых моделейУспел немного потыкать – нравится adaptive reasoning, но сильно не нравится чрезмерная игривость и шутливость без каких-либо изменений в персонализации с моей стороны. А вам как?@notedatascience

💰 LLM против рынка крипты: nof1.aiНа сайте nof1.ai запустили эксперимент Alpha Arena – LLM торгуют криптой за настоящие деньги. Каждой модели выдали по $10.000 и одинаковый промпт с техническими индикаторами, без доступа к новостямСписок участников: GPT-5, Claude 4.5 Sonnet, Grok 4, Gemini 2.5 Pro, DeepSeek V3.1, Qwen 3 MaxСейчас лидирует Qwen 3 Max с доходностью +14% и капиталом $11.4k, следом DeepSeek Chat v3.1 с +10%. Grok 4 и Claude Sonnet 4.5 уже в минусе на ~15-17%, Gemini 2.5 Pro просел почти на -56%, а GPT-5 – абсолютный аутсайдер с -69% от стартового депозита.Ирония в том, что авторы называют рынки ultimate test of intelligence, но по факту тестируют скорее устойчивость к рандому и комиссиям, а долгое время выигрывала модель, которая вообще не трейдила Графики, метрики, сделки и чат: nof1.ai@notedatascience
💬 Yet another dataset?Сегодня — честный обзор на уже захайпленный датасет.Если вы когда-либо занимались ресерчем в рексисе, то точно сталкивались с проблемами датасетов.(Можно вспомнить классическую статью Are We Really Making Much Progress?)Сначала — немного боли из прошлого:— гигантский гэп между train и test— однотипный фидбек— отсутствие разнообразия пользовательских паттерновИ это всё — на фоне постоянных споров в академии про то, что вообще считается хорошим датасетом.Даже если вы соберёте SOTA-модель — она может просто не «прокраситься» на кривом сете.Ну серьёзно, в том же MovieLens test отстоит от train на несколько лет.И вот — датасет от Яндекс Музыки.Огромный:⭐ 4.78 млрд взаимодействий⭐ 9.39 млн треков⭐ 1 млн пользователей⭐ и впервые — флаг is_organic, который показывает:пришёл ли пользователь к треку сам или его привёл алгоритмС одной стороны — это прям must-have для исследовательского пула.Многоуровневый фидбек:⭐ implicit (прослушивания)⭐ explicit (лайки, дизлайки, отмены)Даже эмбеддинги спектрограмм есть.А ещё — продуманный split:⭐ leave-one-last⭐ temporal global(приложу картинку в комментах — очень в тему для продовой оценки)По сравнению с Netflix, Steam и прочими — это реально большой и комплексный датасет.Я бы еще упомянул о бенчмарках и красивом коде куда на мой взгляд легко интегрировать свои решения.Один момент, о котором почти никто не говорит — это домен.Яндекс Музыка — это, как и TikTok, продукт с ярко выраженными короткими и длинными предпочтениями.Здесь трансформеры можно не просто тестировать — здесь они раскрываются.Но. Доверяй, но проверяй.👀 Насколько честно размечена органика?👀 Подходит ли датасет для cold-start задач?👀 Для многих экспериментов вокруг LLM, мне бы хотелось увидеть больше фичей о пользователях, да и в целом фичей. (btw я понимаю, из-за чего их не включают)Спасибо ребятам из Яндекса за такой летний подгон.Реально мощный вклад в сообщество, действительно мало компаний могут себе это позволить.➡️ Hugging Face и arxiv
NVIDIA научила гуманоидных роботов двигаться, как люди - но при нулевом дообучении после переключения из симуляции на реальный мирЕсли коротко, десять лет обучения сжали в две часа симуляции-тренировкиА еще, оказалось, что маленькая модель прекрасно справляется с движениями кожаных:«В модели полтора миллиона параметров, а не миллиард, чтобы повторить подсознительные процессы человеческого тела»
🤖 TidyBot++: применение, статья, кодРебята написали довольно хороший абстракт с документацией для своего проекта, можно хорошенько залипнуть на целый вечер (и собрать своего робота)Вот они, слева направо: сайт, статья, GitHub@notedatascience

⌨️ Change of plans: OpenAI editionАльтман написал, что o3 и o4-mini выйдут через пару недель, а GPT-5 – через несколько месяцев И это после объявлении об их промо-кампании по раздаче подписок Plus американским и канадским студентам. Выпросили! Стоит ли ждать релиза за день до LlamaCon, то есть 28 апреля? 😭@notedatascience
🧿 Live: Introduction to Operator & AgentsТолько что началась трансляция на YouTube канале OpenAI про фичу оператора. Трансляция: https://www.youtube.com/watch?v=CSE77wAdDLgСтатья: https://openai.com/index/computer-using-agent/Reddit: https://www.reddit.com/r/singularity/comments/1i88v45/introduction_to_operator_agents/@notedatascience
📸 Paragraphica: context-to-image cameraНедавно наткнулся на один интересный арт-проект. Paragraphica — это камера, которая использует данные о местоположении и другие показатели для генерации "фото" места и момента. Вот ключевые моменты:🖍️Принцип работы: камера анализирует данные о местоположении — адрес, погоду, время суток и близлежащие объекты. На основе этих данных она генерирует текстовое описание текущего места. 🖍️Технология: с помощью AI image synthesis, текстовое описание преобразуется в визуальное изображение. Это не обычное фото, а визуализация данных, отражающая сущность момента и место, в котором вы находитесь. 🖍️ Оборудование: Raspberry Pi 4, 15-дюймовый сенсорный экран, 3D-печатный корпус, индивидуальная электроника.🖍️Программное обеспечение: Noodl, Python, API Stable Diffusion.Получился супер любопытный проект. По ссылке можно ознакомиться с подробной статьей в картинках с производства, схемах и других деталях @notedatascience

😃 Kaggle x Child Mind Institute: произошел шейкап Пару дней назад подвели результаты Kaggle соревнования Child Mind Institute – Problematic Internet Use. Задача – предсказать уровень проблемного использования интернета детьми и подростками, основываясь на их физической активности 😡Здесь мог бы быть пост о том, как я заслал паблик решение и (чудом) получил серебряную медальку, но получилось еще интереснее: произошел жесткий шейкап. Никогда ведь такого не было – вот тут дискуссия с подобными случаями за 2024 год 🤡Средний шейкап у людей с призовых мест получился +1750 позиций, а на 2 месте так вовсе есть зеленый гусь из Индии с 2 саббмитами, который по приколу залетел в сореву, отправил пару решений и забил за пару месяцев до конца соревнования 🔘Решение зеленого гуся из Индии можно посмотреть здесь. Получились довольно легкие $10.000, да? 😇@notedatascience

🤝 Результаты эксперимента «AI Art Turing Test»В блоге Astral Codex Ten недавно опубликовали результаты эксперимента «AI Art Turing Test». Участникам предлагалось отличить произведения искусства, созданные человеком, от изображений, сгенерированных искусственным интеллектомВот некоторые цифры из результатов:🤝 Средняя точность ответов участников составила примерно 60%🤝 Только около 5% участников смогли правильно идентифицировать более 75% изображений.🤝 Примерно 25% участников показали точность ниже 50%🤝 Некоторые изображения вводили в заблуждение особенно часто: одно из AI generated изображений было идентифицировано как человеческое более чем в 70% случаев.Подробнее об эксперименте и его выводах можно узнать в оригинальной статье: How Did You Do On The AI Art Turing Test?@notedatascience