Машинное обучение RU

@machinelearning_ru

Все о машинном обучении админ - @workakkk@data_analysis_ml - анализ даннных@ai_machinelearning_big_data - Machine learning@itchannels_telegram -лучшие ит-каналы@pythonl - Python@pythonlbooks- python 📚@datascienceiot - 📚РКН: clck.ru/3FmrUw

18 054подписчиков

Ежедневно🇷🇺

Открыть в Telegram

Последние посты

Если хочется не только предсказывать цены на рынке, но и принимать решения на нём, то:Команда Reinforce.fi (ex-Overnight.fi) запускает хакатон по ML, Reinforcement Learning и алгоритмической торговле - Market-Action Arena с призовым фондом $5,000Задача отличается от классического прогнозирования.Для каждого состояния рынка необходимо выбрать одно из 10 возможных действий (A1–A10), чтобы максимизировать итоговую прибыль стратегии.Участникам предоставляются:• реальные рыночные данные с анонимизированными признаками• последовательности длиной 1000 шагов• различные рыночные режимы и временные периоды• train и validation датасеты в формате ParquetМетрика:Score = суммарный PnL по всем принятым решениям.Призовой фонд:1️⃣ $2,5002️⃣ $1,5003️⃣ $1,000Финал соревнования:Топ-10 участников лидерборда предоставляют код или ноутбук для проверки на скрытом датасете. Финалисты презентуют свои решения команде Reinforce.fi в онлайн или офлайн формате.Период проведения:Старт — конец июня 2026 года.Продолжительность — около 1,5–2 месяцев.💬 Telegram-чат участников:https://t.me/+R6lMJ10VXP5hOTI0Регистрация и подробные условия

18 июн. 2026 г.1 270В Telegram

Команда Tongyi Lab из Alibaba представила LOGOS, большую модель для всей естественной науки сразу. Идея простая: если ChatGPT учится предсказывать следующее слово, то LOGOS так же предсказывает следующий кусочек белка, молекулы или реакции. Разные научные объекты записываются одним общим языком токенов.Плюс в том, что модель переносит знания между областями: понятое про молекулы помогает в работе с белками. По словам авторов, на разных задачах LOGOS не уступает моделям, заточенным под конкретную область, а иногда и обходит их. Модель, код и статья уже выложены на HuggingFace, GitHub и arXiv.🤗 HuggingFace: https://huggingface.co/LOGOS-Hub💻 GitHub: https://github.com/LOGOS-Hub/LOGOS📄 Paper: https://arxiv.org/abs/2606.16905Команда Tongyi Lab из Alibaba представила LOGOS, большую модель для всей естественной науки сразу. Идея простая: если ChatGPT учится предсказывать следующее слово, то LOGOS так же предсказывает следующий кусочек белка, молекулы или реакции. Разные научные объекты записываются одним общим языком токенов.Плюс в том, что модель переносит знания между областями: понятое про молекулы помогает в работе с белками. По словам авторов, на разных задачах LOGOS не уступает моделям, заточенным под конкретную область, а иногда и обходит их. Модель, код и статья уже выложены на HuggingFace, GitHub и arXiv.🤗 HuggingFace: https://huggingface.co/LOGOS-Hub💻 GitHub: https://github.com/LOGOS-Hub/LOGOS📄 Paper: https://arxiv.org/abs/2606.16905

17 июн. 2026 г.1 290В Telegram

📢 Открыта регистрация на RecSys Meetup от AI VK 1 июля в Москве инженеры и исследователи AI VK расскажут о трансформерных моделях и LLM-агентах в рекомендациях, представят исследовательское направление и поделятся опытом внедрения технологий Discovery в продукты VK с многомиллионной аудиторией. Спикеры: 🟣 Андрей Зимовнов, директор по AI, VK 🟣 Александр Дьяконов, руководитель отдела исследований AI VK Research 🟣 Евгений Астафуров, ведущий разработчик, AI VK 🟣 Михаил Трапезников, руководитель группы рекомендательных технологий, AI VK В программе: 🟣 Нейропрофиль в Discovery 🟣 Контентные LLM-агенты 🟣 Научные исследования в AI VK 🟣 Cоциальное общение, светомузыка и активности ➡️Регистрация по ссылкеКоличество мест ограничено, трансляции не будет. 📍1 июля, ДК «Кристалл», Москва#aivkhub #recsys

17 июн. 2026 г.1 340В Telegram

Исследователи из Stanford, University of California и Nanjing University представили SEFD - переработанную версию EDGAR filings для обучения LLM на финансовых документах.Главная проблема старого подхода в том, что SEC-отчёты часто превращались в плоский текст. Модель видела слова и цифры, но теряла структуру: вложенные таблицы, объединённые заголовки, отступы, знаки, иерархию строк и связь между показателями.SEFD решает это через layout-faithful MultiMarkdown. Он сохраняет логику документа и финансовых таблиц, но убирает лишний HTML-шум, который раздувает токены и мешает обучению.Публичный снапшот содержит 152 млрд токенов. Полный архив, по оценке авторов, может дать около 550 млрд токенов длинных финансовых документов. При этом пересечение с Common Crawl-корпусами меньше 0,1%, то есть это почти незаезженный источник данных для финансовых LLM.Модели получают структуру отчётности. Для финансового анализа это критично, потому что в таких документах значение часто лежит не в отдельной цифре, а в том, где она стоит, к какому заголовку относится и как связана с соседними строками.arxiv.org/abs/2606.18192v1

17 июн. 2026 г.1 420В Telegram

Рост продуктивности от ИИ не линейный. Он ускоряется по мере глубины использования.Сотрудники, которые активно используют продвинутые возможности ChatGPT вроде GPT-5 Thinking, Deep Research и Image Generation, а также работают с разными моделями и инструментами, сообщают о гораздо большей экономии времени.В новом исследовании OpenAI показано: группа, которая экономит больше 10 часов в неделю, использует примерно в 8 раз больше AI-кредитов, чем сотрудники, которые сообщают о нулевой экономии времени.То есть история не в том, что «дали всем чат-бота и получили небольшой равномерный прирост».Чем глубже люди встраивают мощные AI-функции в свой рабочий процесс, тем сильнее накапливается экономия времени. Активные пользователи превращают ИИ не в случайного помощника, а в полноценного рабочего ассистента.Из отчёта OpenAI “The state of enterprise AI”.openai.com/index/the-state-of-enterprise-ai-2025-report/

16 июн. 2026 г.1 480В Telegram

Исследователи Amazon с помощью серии промптов добились от модели Anthropic Fable информации о небольшом числе уязвимостей безопасности.Amazon передала результаты американским чиновникам. Это помогло запустить экспортные ограничения, из-за которых Anthropic пришлось отключить Fable 5 и Mythos 5 для всех клиентов.Главный спор сейчас в том, что именно показало исследование: серьёзный jailbreak, который раскрыл кибервозможности уровня Mythos, или обычную помощь по кибербезопасности, уже доступную в других продвинутых моделях.Anthropic не согласна с трактовкой правительства. Эксперты по кибербезопасности, изучившие отчёт, тоже сомневаются, стоит ли вообще считать этот случай jailbreak’ом.

15 июн. 2026 г.1 690В Telegram

OpenRouter запустил Fusion - систему, где на один запрос отвечает не одна модель, а сразу несколькоСуть в том, что Fusion отправляет ваш промпт параллельно в разные модели. Каждая модель пытается решить задачу по-своему, при необходимости использует web search и bash-инструменты, а затем отдельный judge сравнивает ответы. После этого synthesizer собирает финальный вариант.Получается не просто «выбор лучшей модели», а полноценная серверная схема коллективного мышления:* несколько моделей работают одновременно;* инструменты помогают проверять факты и считать;* judge отбрасывает слабые ответы;* synthesizer собирает итоговый результат в один связный ответ.OpenRouter утверждает, что Fusion уже обходит frontier-модели на DRACO, deep research benchmark от Perplexity.https://openrouter.ai/fusion@machinelearning_ru

14 июн. 2026 г.8 660В Telegram

🖥 На stepik обновили курс Python в 2026 - рабочий инструмент для автоматизации, ботов, парсинга, API, данных и разработки с ИИ.Проблема новичков в том, что они учат Python кусками: синтаксис, пару задач, немного теории - и потом не понимают, как собрать из этого реальный проект.Этот курс закрывает именно этот разрыв. Здесь вы не просто смотрите уроки, а учитесь писать код, разбирать ошибки и собирать рабочие решения на практике.Внутри:- Python с нуля- много практики без сухой теории- реальные задачи и проекты- автоматизация рутины- работа с файлами, данными и API- понятная логика программирования- современная разработка с ИИ- отдельный блок по вайбкодингуВайбкодинг это нормальный навык 2026 года и вас научат- правильно ставить задачу, проверять код, понимать результат и быстрее доводить проект до рабочего состояния.48 часов скидка 60%: https://stepik.org/course/288218/

13 июн. 2026 г.1 870В Telegram

Title: SIA: Self Improving AI with Harness & Weight UpdatesВ этой работе показали, что ИИ лучше улучшает сам себя, когда меняет не только обвязку вокруг агента, но и обновляет модель.Проблема в том, что прогресс ИИ до сих пор сильно зависит от людей: они вручную правят промпты, инструменты, код, данные для обучения и веса модели.Авторы предлагают SIA - цикл, где один ИИ наблюдает за работой task-agent, а затем улучшает либо его внешнюю настройку, либо саму модель.Внешняя настройка -это промпты, инструменты, правила повторных попыток, парсинг ответа и прочая обвязка. Обновление весов - это изменение поведения модели на основе обратной связи по задаче.Работает это так: агент пробует много ответов или программ, верификатор оценивает результат, а эти оценки превращаются в обучающий сигнал.После этого система обновляет небольшой набор дополнительных весов LoRA. Это меняет поведение модели без полного переобучения.Базовая модель почти не трогается, но LoRA-адаптер постепенно учится: такие ответы давали высокий reward, а такие проваливались.Авторы проверили подход на трёх разных задачах: классификация обвинений в китайском праве, ускорение GPU kernel-кода и denoising single-cell RNA.Комбинированная версия обошла вариант, где улучшали только обвязку: 70.1% на LawBench, более быстрый GPU-код, чем у предыдущего лучшего решения, и 0.289 на задаче denoising.Интересный вывод: хорошая обвязка помогает агенту действовать лучше, но обновление весов помогает ему выучить паттерны задачи, которые одними промптами и инструментами не находятся.arxiv. org/abs/2605.27276

11 июн. 2026 г.2 020В Telegram

ИИ-блогеры после выхода Claude Fable 5

10 июн. 2026 г.2 280В Telegram

WSJ пишет, что OpenAI сделала первый официальный шаг к IPO.Компания конфиденциально подала черновые документы для выхода на биржу.Конфиденциальная форма S-1 позволяет OpenAI начать проверку в SEC, не раскрывая сразу выручку, убытки, структуру клиентов, расходы на вычисления и зарплаты руководителей. Так компания может готовиться к листингу, сохраняя чувствительные цифры закрытыми.На прошлой неделе Anthropic уже подала свои конфиденциальные документы для IPO. Поэтому это больше не только гонка моделей, а ещё и гонка капитала между лабораториями, которым нужно финансировать следующее поколение ИИ-инфраструктуры.wsj.com/tech/ai/openai-kicks-off-ipo-process-in-test-of-investor-appetite-for-top-ai-labs-eb7bebe1

9 июн. 2026 г.1 080В Telegram

✔️ OpenAI переделает ChatGPT в суперприложениеВ ближайшие недели компания проведёт первый крупный редизайн ChatGPT с 2022 года. Сервис трансформируется из диалогового чат-бота в платформу автономных агентов.Обновлённый интерфейс интегрирует партнёрские сервисы для самостоятельного выполнения многошаговых задач без дополнительных промптов и переключения между приложениями.Смена курса обусловлена низкой рентабельностью чат-бота. Перед IPO OpenAI смещает фокус на B2B-сегмент и реструктуризирует продуктовые команды. Бизнес-модель переориентируется на корпоративных клиентов со стабильной монетизацией по аналогии со стратегией Anthropic.ft.com✔️ Инженер из аппаратного подразделения OpenAI перешёл в AnthropicAnthropic наняла бывшего инженера OpenAI Клайва Чана для разработки собственных ИИ-чипов. До этого у компании не было профильного аппаратного подразделения.В OpenAI Чан проектировал кастомный кремний и участвовал в партнёрстве с Broadcom. До этого он разрабатывал чипы для обучения ML-моделей в Tesla Autopilot, где отвечал за архитектуру дата-центров и энергоэффективные вычисления.Найм Чана должен помочь Anthropic сформировать команду аппаратных инженеров. Переход на собственное железо планируется для снижения себестоимости вычислений и повышения маржинальности.Clive Chan в сети Х✔️ TSMC испытывает дефицит производственных мощностейGoogle заказала у Intel производство более 3 млн TPU на 2028 год. Nvidia пока не заключила контракт, но тестирует техпроцессы Intel для будущей GPU-архитектуры Feynman. Причина переноса заказов - из-за нехватки производственных линий у TSMC.Глава TSMC подтвердил, что индустрия не сможет покрыть спрос на ИИ-чипы в ближайшие несколько лет. Дефицит позволил Intel привлечь новых клиентов на фоне прошлых финансовых убытков и срывов дедлайнов.Параллельно SK Hynix проверяет совместимость своей памяти с новыми технологиями упаковки Intel.theinformation.com✔️ Sakana AI займётся алгоритмической эволюцией ИИЯпонский стартап открыл исследовательскую лабо

9 июн. 2026 г.764В Telegram

Rust теперь можно компилировать в JVM bytecode.rustc_codegen_jvm - экспериментальный backend для компилятора Rust, который берёт Rust MIR и превращает его в .class файлы, а затем собирает runnable .jar под JVM 8+.Что уже заявлено:- генерация исполняемого .jar- поддержка базового core- if/else, match, for, while, loop- structs, tuples, arrays, slices, enums- traits, closures, dynamic dispatch- function pointers, recursion, generics- часть unsafe, включая unions- оптимизации вроде constant folding, propagation и dead code eliminationПайплайн выглядит так:Rust frontend → MIR → OOMIR → JVM classfile → R8 → .jarhttps://github.com/IntegralPilot/rustc_codegen_jvm

7 июн. 2026 г.1 770В Telegram

Liquid AI выпустили две компактные модели под японский язык: речевую LFM2.5-Audio-1.5B-JP и языковую LFM2.5-1.2B-JP-202606.Самое интересное здесь - речевая модель. LFM2.5-Audio-1.5B-JP умеет принимать японскую речь и отвечать японской речью напрямую. Это не связка из ASR + LLM + TTS, а единая end-to-end модель для полного речевого цикла.Что заявляют по LFM2.5-Audio-1.5B-JP:- 1.5B параметров- первая японская speech-to-speech модель Liquid AI- превосходит J-Moshi примерно на 77B параметров- показывает уровень, близкий к Qwen2.5-Omni-3B- подходит как базовая модель для дальнейшего дообученияВторая модель - LFM2.5-1.2B-JP-202606, обновлённая японская LLM на 1.2B параметров. Предыдущая версия уже обходила Qwen3-1.7B и Llama 3.2 1B на JMMLU, M-IFEval и GSM8K. В новой версии улучшили смесь японских данных, промежуточное обучение и пост-тренинг.https://huggingface.co/LiquidAI/LFM2.5-Audio-1.5B-JPhttps://huggingface.co/LiquidAI/LFM2.5-1.2B-JP-202606

6 июн. 2026 г.1 740В Telegram

🚀 GPU-библиотека для классического машинного обученияFlashLib предлагает высокопроизводительные реализации операторов машинного обучения, таких как kmeans, PCA и DBSCAN, с использованием Triton и CuteDSL. Библиотека позволяет эффективно обрабатывать данные на GPU, обеспечивая простоту использования и высокую скорость выполнения.🚀Основные моменты:- Поддержка 15 высокоуровневых примитивов для машинного обучения.- Информативный API для оценки производительности операций.- Оптимизированные реализации для кластеризации, регрессии и декомпозиции.- Легкая интеграция с PyTorch и sklearn.📌 GitHub: https://github.com/FlashML-org/flashlib#python

5 июн. 2026 г.1 910В Telegram

🚀 Упрощение разработки с GSD ReduxGSD Redux — это легковесная система для метапромптинга и управления контекстом, помогающая разработчикам эффективно работать с AI. Она решает проблему деградации качества контекста, позволяя создавать четкие спецификации и контролировать процесс разработки.🚀 Основные моменты:- Легкая интеграция с различными AI-платформами.- Поддержка автоматизации разработки и управления проектами.- Обеспечивает безопасность и прозрачность через аудит.- Подходит для индивидуальных разработчиков и небольших команд.📌 GitHub: https://github.com/open-gsd/get-shit-done-redux#javascript

3 июн. 2026 г.2 050В Telegram

⚡️ Сэм Альтман подтвердил возвращение OpenAI к разработке воплощенного ИИПроект вырос из исследований по симуляции физического мира, к которым присоединилась команда видеогенератора Sora.На начальном этапе компания сосредоточится на разработке специализированных машин для помощи в строительстве инфраструктуры. Конечная цель проекта - обеспечить каждого человека персональным роботом, способным выполнять любые бытовые и рабочие поручения.В 2020 году компания закрыла предыдущие проекты в робототехнике из-за дефицита обучающих данных. Для перезапуска направления OpenAI открыла наем инженеров по аппаратному обеспечению, системной интеграции и ML. Возвращение связано с развитием воплощенного ИИ: взаимодействие алгоритмов с физической средой позволит собрать массивы данных, необходимых для обучения AGI.@ai_machinelearning_big_data#news #ai #ml

2 июн. 2026 г.1 630В Telegram

VINS-120K - полезный датасет для следующего этапа image editing моделей: редактирование изображений в 4K+ без развала мелких деталей.Сейчас многие модели неплохо правят обычные картинки, но на сверхвысоком разрешении быстро всплывают проблемы: текстуры мажутся, локальные правки портят соседние области, а результат выглядит хорошо только после уменьшения. Для реального продакшена этого мало.VINS-120K закрывает именно этот разрыв. В датасете 120 тысяч троек: инструкция, исходное изображение и отредактированная версия. Все изображения выше 4K, данные собраны из реальных видео высокого разрешения и качественных открытых источников, затем отфильтрованы по визуальному качеству, соответствию инструкции и эстетике.Покрытие тоже широкое: 13 типов редактирования в 4 категориях - локальные правки, глобальные изменения, движение камеры и персонализированная генерация.Paper: https://modelscope.ai/papers/2605.23518Dataset: https://modelscope.cn/datasets/vivo/VINS-120K

1 июн. 2026 г.1 780В Telegram

Устал инициализировать претрейны весами Qwen? Приходи к нам — мы честно учим с нуля! 😉Ищем Senior/Senior+ AI Engineer и продактов в RnD-команду: как отдельных специалистов, так и целые команды, — которые готовы разрабатывать прорывные AI-решения.Познакомиться ближе с нашими направлениями и оставить отклик можно на сайте.А если хотите следить за тем, как команда RnD ML Сбера исследует и разрабатывает AI-технологии, — подписывайтесь на Telegram-канал команды. Там делятся исследованиями, экспериментами и инсайтами из мира AI, а также свежими вакансиями 🚀

1 июн. 2026 г.1 690В Telegram

PaddleOCR-VL 1.6 официально вышелPaddlePaddle выпустили PaddleOCR-VL 1.6 - новую версию модели для распознавания документов.Результат: 96.33% на OmniDocBench. Это новый SOTA, причём модель обошла как open-source, так и закрытые решения в распознавании текста, формул и таблиц.Что улучшили:- первое место на OmniDocBench v1.5 и Real5-OmniDocBench- заметно лучше распознаёт таблицы, обычный текст и редкие символы- улучшено распознавание печатей, отдельных фрагментов и графиков- полная совместимость с архитектурой v1.5- миграция не нужна - можно подключать как plug-and-playГде это полезно:- финансовые контракты- юридические документы- исследовательские отчёты- исторические архивы- RAG-пайплайны- подготовка качественных данных для LLMhttps://github.com/PaddlePaddle/PaddleOCR#PaddlePaddle #PaddleOCR #AI #ComputerVisionPaddleOCR-VL 1.6 официально вышелPaddlePaddle выпустили PaddleOCR-VL 1.6 - новую версию модели для распознавания документов.Результат: 96.33% на OmniDocBench. Это новый SOTA, причём модель обошла как open-source, так и закрытые решения в распознавании текста, формул и таблиц.Что улучшили:- первое место на OmniDocBench v1.5 и Real5-OmniDocBench- заметно лучше распознаёт таблицы, обычный текст и редкие символы- улучшено распознавание печатей, отдельных фрагментов и графиков- полная совместимость с архитектурой v1.5- миграция не нужна - можно подключать как plug-and-playГде это полезно:- финансовые контракты- юридические документы- исследовательские отчёты- исторические архивы- RAG-пайплайны- подготовка качественных данных для LLMhttps://github.com/PaddlePaddle/PaddleOCR#PaddlePaddle #PaddleOCR #AI #ComputerVision

29 мая 2026 г.2 120В Telegram

Машинное обучение RU

Похожие каналы

Последние посты