Kaggle Nemotron Competition Writeup for the 1st place: codex написал весь код, но думать он не смогhttps://www.kaggle.com/competitions/nvidia-nemotron-model-reasoning-challenge/writeups/1st-place-solutionЗакончилось очередное соревнование на каггле. Участник победившей команды поделился опытом:"All code was written with Codex. We did not write a single line of code directly. However, the ideas, analysis direction, and trace design decisions that improved the score almost never came from Codex."Но есть нюанс:"I don't know for sure, but other than Gemini 3.1 Pro Extended, almost all other AIs were giving conflicting ideas, and most of those ideas were just bad. Specially Claude, like it was deliberately trying to emphasize on an already wrong proven hypothesis. One thing this competition taught me is, AI is still far way from working without intervention."Всё, решено - далеко нам до AGI.#ai #kaggle
(sci)Berloga Всех Наук и Технологий
@sberlogabig
Мультидисциплинарный канал о науке и технологиях.Data Science, Bioinformatics, Biology, Mathematics, Physics, IT, Computer Science.@sberlogabio био и дата сайнс@sberlogasci математика, физика и ДСhttps://www.youtube.com/c/SciBerloga
Похожие каналы
Все →Последние посты

Современные проблемы биологии: AI решит всё?Лет десять назад на тех, кто пытался применять искусственный интеллект в своих исследованиях, в академическом сообществе смотрели косо. Но затем нейросети стали обыгрывать человека в го и шахматы, научились предсказывать укладку белка, а потом начался бум генеративных моделей. Если отбросить хайп, сегодня разработка AI-алгоритмов выглядит как кратчайший путь к успеху в науке. Вызовы, казавшиеся невозможными, преодолеваются благодаря машинному обучению.Факультет биоинженерии и биоинформатики МГУ и компания Бластим продолжают серию лекций о трендах и перспективах в биотехе. Следующая встреча с доктором биологических наук, профессором ФББ МГУ Борисом Фенюком состоится в понедельник 8 июня в 15:00 мск.Борис Александрович поделится своим видением будущего и расскажет, как AI изменил естественные науки и какие открытия уже внедрены в индустрию:• предсказание структуры белков• анализ геномов• in silico drug design• персонализированная медицина• синтетическая биология🔗 Зарегистрироваться и оставить вопрос на сайте: https://agency.blastim.ru/bio_aiИли быстро в боте: https://s.salebot.pro/fbbmsu_ai_1
Свежая работа по ИИ в математических доказательствах от Google DeepMind (AlphaProof)Успехи ИИ в решении серьёзных математических задач уже мало кого удивляют, но новая работа Google DeepMind интересна не только результатами, а тем, как именно они были получены.Исследователи представили AlphaProof Nexus — систему, где LLM перестаёт быть просто генератором текста и начинает работать как полноценный агент внутри среды с обратной связью.Это важный сдвиг.Главная проблема обычных LLM — галлюцинации. Для математики это критично: одна ошибка ломает всё доказательство. Но вместо попыток «сделать модель аккуратнее» исследователи изменили сам процесс работы ИИ.Ключевая идея в том, что модель больше не работает в вакууме. Теперь у неё есть внешняя система проверки, которая может мгновенно подтвердить или опровергнуть каждый шаг рассуждений.Для этого используется Lean — язык формальных математических доказательств, где каждое утверждение проходит строгую автоматическую верификацию компилятором.Получается такой цикл:— модель предлагает следующий шаг доказательства;— система проверки валидирует его;— при ошибке агент получает точную обратную связь;— корректирует стратегию;— и продолжает поиск решения.То есть система работает уже не как чат-бот, выдающий ответ за один проход, а как агент, взаимодействующий со средой и постоянно адаптирующий свои действия.Именно это сейчас становится одним из главных направлений развития ИИ:не просто “больше нейронных связей”, а появление цикловгенерация → проверка → обратная связь → исправление → новая попытка.По сути, модель получает нечто похожее на настоящий исследовательский процесс.Результаты при этом очень серьёзные:— решены 9 открытых задач Эрдёша;— доказаны 44 гипотезы из OEIS;— найден контрпример к одной из гипотез Бена Грина;— продвинут 15-летний спор в алгебраической геометрии.Но, возможно, главный вывод работы даже не в математике.Похоже, что следующий этап развития ИИ — это не «ещё более умные чат-боты», а системы, которые умеют:— долг
#дайджестДайджест AI/ML за неделю 18-24 мая 2026Google: Gemini 3.5 FlashНа этой неделе прошел Google I/O, на котором фронтир убийцу беэнчмарков не показали (пообещали через месяц), но выпустили лучшую рабочую лошадку. Flash модель, которая теперь обходит прежний флагман 3.1 Pro на агентных и кодинговых задачах (на них был упор) со скоростью ~280 т/с. Цена $1.50/$9, сильно дороже чем раньше, но сильно дешевле чем например Sonnet.Блогпост, Карточка моделиGoogle: Gemini OmniОчень мультимодальная модель, текст/картинка/звук/видео на входе, на выходе пока только видео, картинки и звук обещают позже. Можно разговаривать с генератором видео, наконец-то.БлогпостAlibaba: Qwen 3.7-MaxФлагманская text-only модель под длинные агентные задачи. Опять закрытая :с 1M контекст, $2.50/$7.50 за 1M. SWE-bench Pro 60.6 (между Opus 4.6 и 4.7), Terminal-Bench 69.7 (лидер). В демо 35 часов автономной работы и 1158 вызовов инструментов. Самый низкий hallucination rate ~22.9%. Plus-версия (мультимодальная) обещана позже с открытыми весами.Блогпост, Alibaba Cloud, OpenRouterCohere: Command A+первый открытый фронтир от Cohere. 218B MoE (25B активных). Объединяет четыре прежние модели (Command A / Reasoning / Vision / Translate) в одну. 48 языков, нативные ссылки на источники в ответах. Блогпост , HFDatadog: Toto 2.0 открытое семейство моделей TSFM (time series foundation models) размерами от 4M до 2.5B. Главный посыл репорта в том что для задачи предсказания временных рядов тоже работает Scaling law и общие модели на все задачи подряд. Статья, БлогпостМенее значительные релизы:DeepSeek: V4-Pro стал в 4 раза дешевле навсегда ($0.435/$0.87) ПрайсингByteDance: Lance — открытая 3B-активных мультимодальная модель: понимание, генерация и редактирование картинок и видео. Статья, GitHubPerplexity: Bumblebee - оупенсорс read-only сканер ИИ-окружений. проверяет конфиги агентов, расширения редакторов и пакетные зависимости. Блогпост, GitHubMicrosoft: RAMPART + Clarity - еще два опенсорс-инструмента для

Обзор актуальных ИИ-инструментов для жизни и рисечаВот скажите честно, вы можете объяснить, чем языковая модель отличается от чат-бота? А агентный ИИ от ИИ-агента? Почему нейросети умные, но с такой плохой памятью? Сложное. К сожалению, большинство ИИ-экспертов жонглируют модными терминами и хвастаются очередными успешными успехами. Но у обычных людей это вызывает только вопросы и непонимание.Чтобы избавиться от тумана в голове, Бластим приглашает на лекцию Сергея Антопольского — человека с уникальным опытом: в науке и индустрии, в нейробиологии и нейросетях. Вечером 20 мая спикер поможет слушателям составить цельную картину современных ИИ-инструментов: как они устроены на практике, чем отличаются, как их применять осознанно и безопасно. Готовы?Программа встречи очень насыщенная:• Базовая терминология: языковые модели, боты, агенты, harness• Роли ИИ сегодня: собеседник, помощник, аналитик, кодер и многое другое• Лестница доступа: чат в браузере, приложение с доступом к файлам или агент, полностью управляющий вашим ПК• Контекст, память и компактизация: как работать с длинными задачами и проектами• Практические примеры использования ИИ• Оверхайп и фомо в области🔗 Подробности и регистрация: https://agency.blastim.ru/neuro2neuro🔗 Или моментальная запись в боте: https://s.salebot.pro/ai_web_1Не пропустите — на этот раз всё разложат по полочкам!

Квантовые алгоритмы и графы Кэли🌀1/2Как мы уже писали, коллеги, техника дошла до того, что любой желающий может проводить вычисления на реальных квантовых чипах IBM. Я решил пойти дальше простых примеров и попробовать реализовать алгоритмы поиска на графах Кэли (математическая модель вращательных пазлов вроде Кубика Рубика).Пока провожу тесты в симуляции, но скоро планирую запуск на реальном квантовом железе. Получится ли что-то вменяемое? Не факт. Техническое несовершенство квантовых чипов - это раз. А два - алгоритмические вызовы. Квантовые алгоритмы требуют совершенно иной логики проектирования — это не просто «быстрый компьютер», а другая парадигма мышления. Квантовые аналоги многих классических алгоритмов пока просто неизвестны.Продолжение тут 👇

Фрактальная ОдиссеяПолвека назад Мандельброт придумал слово «фрактал». В честь этого 23 мая мы делаем фестиваль о красоте математики. Все наши активности связаны общей идеей: показать эту красоту с разных сторон — через математические сюжеты, через искусство, через музыку, через науку. От лекций и мастерских до перформансов и ночной дискотеки — всё это разные подступы к одной теме🔵 Начнём в 14:00 в библиотеке Достоевского, а во второй половине дня переместимся в соседний клуб Лахесис и продолжим там до 4 утра🟠 Главный партнёр фестиваля — Technology Leaders of the Future, стипендиальная программа Фонда Тимашева. TLF предоставляет школьникам 14–17 лет, сильным в математике, физике или информатике, полностью оплаченные стипендии на обучение в The Island School (Кипр) и H-FARM International School (Италия). Первая когорта из 60 школьников уже учится; поступление на 2026/2027 ещё доступно — сильных кандидатов мы готовы рассматривать по Fast Track🔴 ЛекцииМихаил Гельфанд расскажет про иерархию бесконечностей, Александра Скрипченко — про математику живого, Андрей Райгородский — про раскраски плоскости, Вячеслав Гусев — про фракталы внутри нейросетей. Утром в библиотеке Михаил Евдокимов расскажет про лучшие визуальные задачи для любого возраста, а Ваня Яковлев и Полина Романова — про фракталы вокруг нас🔴 Мастерские и станцииДвадцать активностей, которые стоит посетить и попробовать своими руками: дерево Пифагора и ковёр Аполлония, печать фрактальных тайлингов, витражи, симметрия наноматериалов, квантовые эксперименты, морские фракталы, VR-путешествие, эволюция графов, лингвистические задачи, оригами, мастер-класс по терменвоксу, тай-дай, японская каллиграфия и другие🔴 Кино, искусство, перформансыАрт-программа включает в себя фрактальную живопись Петра Николаева, работы Александра Солеева, Александра Вайсмана, Алекса Мухина, Ирины Канделариа, группы Evpraxis, а также видео-арт от группы «Явь», «Cactus Juice», художников Артёма Ткача, Meta Chaos и многое другоеВ социально

⚡️️️ Большой обзор новинок искусственного интеллекта 2026Нейросети сыплются как из рога изобилия, угнаться за ними нереально. ИИ-исследователи уже не ждут выхода статей, а спешат доложиться на конференциях — так быстрее. Как же нам, простым юзерам, отделить зерна от плевел и найти для себя полезное в этом водовороте? Как получить доступ к передовым инструментам в обход блокировок и ограничений? Если вы застряли в использовании ИИ на уровне диалогов с чат-ботами и ждете руку помощи — вот она!13 мая в 19:00 мск эксперт Бластима Александр Декан сделает срез новинок и трендов и покажет, какие навыки работы с ИИ реально востребованы.Программа:• Краткий экскурс в историю ИИ: от истоков до последних прорывов• Топовые кейсы применения флагманских LLM от OpenAI, Anthropic и Google• Продвинутая автономия: поручаешь модели задачи, и она трудится сутки напролет• Прогнозы: насколько нейросети станут умнее, дешевле и мощнее через 3 года 🔗 Записаться: https://agency.blastim.ru/homo_promptusТехнологии развиваются стремительно, и нужно адаптироваться. Если не стать Homo promptus, то есть риск разделить судьбу неандертальцев. Не пропустите обзор от Бластим!

ФЕНОМЕНАЛЬНО!Именно такую оценку дал ведущий мировой специалист по вычислительным аспектам головоломок Tomas Rokicki результату Влада Кузнецова (МФТИ), полученному на основе методологии проекта CayleyPy. С помощью этого подхода удалось найти более короткие решения для некоторых состояний Megaminx, чем те, что ранее были получены ценой огромных усилий. Ниже Tomas Rokicki пишет, что потратил месяцы работы, задействовал весь свой колоссальный опыт и значительные вычислительные ресурсы, чтобы найти решения для суперфлипов Megaminx. Новый подход, основанный на нейронных сетях, позволил получить улучшенные решения при затратах времени и вычислительных ресурсов, меньших на порядок.Поздравим Влада с мировым рекордом в этой области ! А также напоминаем, что мы приглашаем всех присоединится к нашему проекту CayleyPy на стыке ИИ, математики, физики и пазлов. И поучаствовать в соревнованиях по созданию наиболее точных ИИ алгоритмов для решения задач дискретной оптимизации см. подробнее - https://t.me/sberlogabig/643 . Мы используем пазлы как бенчмарк для RL алгоритмов планирования или pathfinding, которые имеют применение в широком спектре вопросов от квантовых вычислений до ллм и теории струн.

🚀 Серия соревнований по МЛ и научный проект ! Денежный призовой фонд больше 150 000 р и будет расти ! Кому интересен МЛ/RL или математика или пазлы или роботы. Приглашаем Вас принять участие в серии челленджей и развитии научного опен-соурс проекта. Соревнование организуется совместно с учеными лаборатории интеллектуальных технологий робототехники МФТИ, (руководит проектом - Илья Осокин), которые поставили себе амбициозную цель создать робота, который побьет мировой рекорд по сборке Мегаминкса ! Узнать больше о робототехнической части проекта Вы можете в сообщении д.ф.-м.н. А. Арутюнова: https://t.me/forodirchNEWS/3165 , или хабре или чате @starkitmega.Проект CayleyPy предлагает Вам принять участие в решении алгоритмической части задачи - создании алгоритмов - которые смогут получать наиболее короткие (близкие к оптимальным ) решения. Методы решения важны в широком круге проблем от математики до квантовых компьютеров, МЛ/РЛ и теории струн. Для этого мы организовали соревнования на платформе Каггл. Первый Второй разыгрываемый приз - 10 000 рублей.Условия первого второго этапа очень простые.Есть три челленджа на КагглеМегаминксhttps://www.kaggle.com/competitions/cayley-py-megaminx/leaderboardКубик Рубика 333https://www.kaggle.com/competitions/cayleypy-ihes-cubeКубик Рубика 444https://www.kaggle.com/competitions/cayley-py-444-cube Приз будет получен первым, кто достигнет ЛЮБУЮ из целей:1 Или в конкурсе Мегаминкс - кто достигает скор 75 000 (вы получите 5 000 рублей, 70 000 ещё 5 000 рублей) и опубликует публичное решение. (Первая цель 80 000 уже достигнута. Приз уйдёт Владу Кузнецову, МФТИ).2 Или обогнать Томаса Рокицкого в конкурсах по кубику 333 или 444 (любом из них) и тоже опубликовать публичное решение. (Томас Рокицкий - легендарный специалист по вычислительным аспектам головоломок - именно его команда нашла "число Бога" кубика Рубика в 2010 году - подведя итог более 30 годам усилий большого количества специалистов). Подробное описание соревнований --

Запилили открытый учебник по Reinforcement Learning — от жадных бандитов до выравнивания LLM.Идея — собрать в одну книгу путь от классической теории RL до современных RLHF-пайплайнов и reasoning-моделей. 320 страниц, 17 глав в 4 частях:1. Основы: бандиты, MDP, DP, Monte Carlo, TD-learning 2. Глубокое RL: DQN, policy gradient, actor-critic, PPO с GAE 3. RLHF и выравнивание: модели вознаграждения, DPO/IPO/KTO/ORPO, GRPO, RLVR 4. Настоящий фронтир уровень: reasoning, chain-of-thought, агентные и мультиагентные системы + их обучениеК каждой главе идет Jupyter-ноутбук (запускается в бесплатном Colab) и задачи с решениями. Внутри - разбор кейсов InstructGPT, Llama 2, Constitutional AI и DeepSeek-R1. Есть черновой перевод на русский.По материалу уже готовились (и успешно прошли) собесы в топ-компании на hard-RL секции, а скоро его пустят в печатьЕсли зайдёт — буду благодарен звезде на GitHub ⭐️ так учебник смогут найти новые люди через рекомендации платформыгитхаби перевод на русский🏔 Сообщество ML-энтузиастов и AI в горахТелеграм: @mountainai_infoСайт: https://mountainai.techЗапилили открытый учебник по Reinforcement Learning — от жадных бандитов до выравнивания LLM.Идея — собрать в одну книгу путь от классической теории RL до современных RLHF-пайплайнов и reasoning-моделей. 320 страниц, 17 глав в 4 частях:1. Основы: бандиты, MDP, DP, Monte Carlo, TD-learning 2. Глубокое RL: DQN, policy gradient, actor-critic, PPO с GAE 3. RLHF и выравнивание: модели вознаграждения, DPO/IPO/KTO/ORPO, GRPO, RLVR 4. Настоящий фронтир уровень: reasoning, chain-of-thought, агентные и мультиагентные системы + их обучениеК каждой главе идет Jupyter-ноутбук (запускается в бесплатном Colab) и задачи с решениями. Внутри - разбор кейсов InstructGPT, Llama 2, Constitutional AI и DeepSeek-R1. Есть черновой перевод на русский.По материалу уже готовились (и успешно прошли) собесы в топ-компании на hard-RL секции, а скоро его пустят в печатьЕсли зайдёт — буду благодарен звезде на GitHub ⭐️ так учеб

Внезапно, панкейки 🥞 Допустим, у нас есть набор последовательных натуральных чисел, расставленных в произвольном порядке.Такие последовательности называются перестановками, и для каждой выбранной длины n их количество будет составлять ровно n! Например, перестановки длины 3 будут выглядеть так:123, 132, 213, 231, 312, 321.Их количество равно 3! = 1•2•3 = 6 Введем операцию "флип", смысл которой можно описать так:"Возьми первые k чисел в перестановке и расставь в обратном порядке". Для краткости будем обозначать ее Rk (reverse k). Например, 123 -> R2 -> 213123 -> R3 -> 321 Назовем упорядоченной перестановку, в которой числа расставлены в порядке возрастания. Сможем ли мы построить последовательность флипов, переводящую произвольную перестановку в упорядоченную? Спойлер: да, и этот алгоритм несложно придумать. Рекомендую попробовать.Эта задача называется блинной сортировкой (pancake sorting). И алгоритм построения самой короткой последовательности флипов человечеству неизвестен по сей день.
Как построить AI-First компаниюНовое видео забирает титул самого полезного на канале.📹 https://youtu.be/Q7pI3uUwfTIЭтот рассказ о том, через что вам придется пройти, чтобы превратить компанию в AI-First. Что вообще такое AI-First и чем это отличатся от компаний прошлой эпохи? Может ли в такой компании быть только CEO и 1000 агентов? Как вообще перекладывать опыт людей в AI-агентов и кто этим должен заниматься?Видео не просто про идеологию, оно также задевает техничку. Без каких составных частей вам никогда не построить новое будущее? В чем отличие инфраструктурых от бизнесовых скиллов и кто должен их писать? Сколько придется нанять программистов, чтобы написать 100500 агентов?На самом деле, это не просто доклад. Это результат нескольких месяцев мыслей, разговоров с умными людьми и экспериментов, которые постепенно сошлись в нечто законченное, чем не стыдно поделиться.Оно будет полезно и первым лицам компаний и людям ответственным за AI-трансформацию, а также тем, кто просто хорош в своей профессии и хочет поменять мир.И последнее - если сейчас в вашей компании не происходит ничего подобного, это уже красный флажок. И возможно, именно вы станете тем, кто начнет это направление.Дерзайте! 👍———На докладе у слушателей было задание - искать проблемы этой логики и ушатывать меня, за это давали призы. Можно продолжить в комментариях, за самые жесткие панчи найду что подарить.
И напоминаем о нашем совместом конкурсе с коллегами: https://t.me/sberlogabig/643

Мировой рекорд и россыпь наград: «Старкит» покоряет Тайвань 🤖⚽️Команда МФТИ по робобутболу «Старкит» триумфально выступили на международном кубке International Intelligent RoboSports Cup 2026 (FIRA Asia). Среди 101 команды со всего мира физтехи вновь доказали, что наша школа робототехники — одна из сильнейших на планете!Достижения:🥇 1 место — HuroCup Adult Hybrid🥈 2 место — HuroCup Adult Mobility🥈 2 место — Общий зачет HuroCup Adult🥈 2 место — AndroSot🥉 3 место — HuroCup Kid HybridСенсация турнира: робот команды «Старкит» установил мировой рекорд, пробежав спринт всего за 14,4 секунды 🎉Также этом году наши ребята помогли команде талантливых школьников из Татарстана попасть на турнир в Гаосюне, проконсультировав их по визам и правилам участия.Поздравляем «Старкит» с фантастическим результатом! #МФТИ #Физтех #Старкит #Робофутбол #STARKIT #Робототехника #Минобрнауки #FIRA2026Мировой рекорд и россыпь наград: «Старкит» покоряет Тайвань 🤖⚽️Команда МФТИ по робобутболу «Старкит» триумфально выступили на международном кубке International Intelligent RoboSports Cup 2026 (FIRA Asia). Среди 101 команды со всего мира физтехи вновь доказали, что наша школа робототехники — одна из сильнейших на планете!Достижения:🥇 1 место — HuroCup Adult Hybrid🥈 2 место — HuroCup Adult Mobility🥈 2 место — Общий зачет HuroCup Adult🥈 2 место — AndroSot🥉 3 место — HuroCup Kid HybridСенсация турнира: робот команды «Старкит» установил мировой рекорд, пробежав спринт всего за 14,4 секунды 🎉Также этом году наши ребята помогли команде талантливых школьников из Татарстана попасть на турнир в Гаосюне, проконсультировав их по визам и правилам участия.Поздравляем «Старкит» с фантастическим результатом! #МФТИ #Физтех #Старкит #Робофутбол #STARKIT #Робототехника #Минобрнауки #FIRA2026