Новый набор в Академию Авито!Всем привет! Я Алина, DS-инженер в команде горизонтальных ML-технологий и руководитель DS-трека Академии.Каждый год мы бесплатно обучаем аналитиков данных и DS-инженеров — и сейчас открываем новый набор 🔔В программе◽️ фундамент из теории и много практики на реальных задачах Авито 🔘 обучение у действующих сотрудников и экспертов Авито ◽️ личный ментор и карьерная поддержка 🔘 сообщество единомышленников📹 Если хотите больше узнать про треки, формат обучения и отбор — приходите на прямой эфир 22 июня в 17:00, расскажем про программу и ответим на ваши вопросы! Подключиться👉 Обучение стартует 1 сентября! Ждём ваши заявки до 2 июля.Подать заявку
Что будет этим летом 📣Принесли подборку конференций для ML-инженеров, DS, MLOps и всех, кто строит AI-продукты.HighLoad++ 🔔 Что там: крупная конференция, на которую ежегодно привозят много сильных докладов про AI-инфраструктуру, распределенные системы, Data Platform и эксплуатацию ML в продакшене. И не только.Когда и где: Питер, 22 и 23 июняConversations🔔Что там: одна из крупнейших конференций о генеративном AI для тех, кто внедряет, строит продукты и принимает решения о GenAI-трансформации Когда и где: Питер, 25 и 26 июняSummer Merge🔔Что там: летняя конференция для инженеров и разработчиков с акцентом на технологии, архитектуру и современные практики разработки.Когда и где: Ульяновск, 3, 4 и 5 июляPROIT Fest🔔Что там: фестиваль для IT-сообщества с докладами, практикой и возможностью познакомиться с экспертами из разных направлений. Когда и где: Питер, 11 июляTurbo ML Conf 🔔Что там: конференция от Т-Банка для специалистов с опытом в ML. В программе фундаментальные исследования, GenAI, ML Infrastructure, платформы и production-кейсы. Когда и где: Москва, 18 июляIT Picnic🔔Что там: большой технологический фестиваль под открытым небом. Много инженерных активностей, доклады, нетворкинг и атмосфера летнего tech-праздника. Когда и где: Москва, 8 августаЗнаете другие достойные конференции этого сезона? Делитесь в комментариях ⬇️
Я знаю, что всё знаю 😀Привет, с вами Андрей, DS-инженер в команде горизонтальных ML-технологий и любитель периодически читать холиварные статьи.Не кажется ли вам, что в эти непростые времена повсеместного ЭйАй мы начинаем путать то, что знаем, с тем, что думаем, что знаем? Таким вопросом задались авторы статьи The LLM Fallacy: Misattribution in AI-Assisted Cognitive Workflows. И пару недель назад я наткнулся на эту публикацию.Статья не техническая, скорее вводная — авторы предлагают новый термин LLM Fallacy. Если коротко — это когнитивное искажение, при котором человек принимает результат работы LLM за свидетельство собственной компетентности 🤟По мнению авторов, ощущение возникает из-за нескольких причин:1️⃣ LLM быстро выдаёт результат,2️⃣ Результат часто достаточно убедительный,3️⃣ Промежуточные шаги обычно скрыты.Это размывает границу между вкладом человека и модели: мы быстро получили хороший результат ➡️ мы кожаные мешки, молодцы ➡️ плюсик в послужной список ⭐️Для разработчиков разного толка и им сочувствующих, это особенно заметно. Не имея ни малейшего представления о программировании, архитектуре и паттернах проектирования, человек может запустить рабочий, до некоторого момента 😈, сервис. И когда (а не если) всё ломается, всплывает реальный уровень понимания.Принципиально нового в статье я особо не увидел, и сами авторы это признают: прямо называют LLM Fallacy частным случаем более широкого искажения (да, эффект Даннинга — Крюгера — я смотрю на тебя). И раньше появлялось нечто, что так же влияло на восприятие наших способностей: 👉 калькуляторы, без которых не все могут разделить 80 на 0.5, 👉 StackOverflow, на котором выросло не одно поколение разработчиков, 👉 автокомплит в IDE, без которого не вспомнить сигнатуру привычной функции. LLM возводит этот эффект в абсолют и делает его менее заметным для самого пользователя.Но интереснее не само искажение, а оценка компетенций. Если человек решает задачу вместе с LLM, важно ли, может он сделать всё сам или нет?
📊 Сеньор перестаёт писать код? Проверили на данныхНедавно мы провели опрос среди ML-инженеров из топовых российских Big Tech компаний (Авито, Яндекс, Сбер, Ozon, Lamoda и др.), чтобы понять, на что уходит рабочее время в зависимости от грейда.Главным сюрпризом стало то, что и Middle, и Senior тратят около 60% рабочего времени на работу руками — код и ML-задачи, поэтому наши данные не подтверждают тезис «вырос в грейде -> перестал кодить».У тимлидов и менеджеров ML-активности проседают до ~22% от общего времени, что логично и ожидаемо.Меняется коммуникация 👇🟢 Middle — Код+ML 62% · Встречи 14% · Асинхрон 17% -> удовлетворенность 3.4/5🔵 Senior — Код+ML 61% · Встречи 23% · Асинхрон 9% -> удовлетворенность 4.0/5➡️ При переходе от Middle к Senior время на встречи увеличивается с 14 до 23%, а на переписку уменьшается с 17 до 9%. 😮 Самый недовольный грейд — это Middle (3.4/5). Основные причины — это переключение контекста между проектами и хрупкая ML-инфра. Оба фактора набрали по 62%. У сеньоров переключение контекста болит в пять раз реже (12%), зато сильнее давят встречи и бюрократия.💡 Дополнительные 10 часов в неделю 62% мидлов хотят потратить на рефакторинг, 50% — на исследования, а учиться и высыпаться хотят вообще все!Итог. С грейдом меняется не количество ручной работы, а объём, длительность и формат общения. Самый турбулентный участок пути — middle.Узнали себя? 👇 Напишите в комментариях, что вы об этом думаете!P.S. В опросе поучаствовали 33 ML-инженера; грейд указали 18 из них — по 8 на Middle и Senior. Выборка небольшая, так что это скорее повод задуматься и сверить с собственным опытом, чем строгая статистика.📊 Сеньор перестаёт писать код? Проверили на данныхНедавно мы провели опрос среди ML-инженеров из топовых российских Big Tech компаний (Авито, Яндекс, Сбер, Ozon, Lamoda и др.), чтобы понять, на что уходит рабочее время в зависимости от грейда.Главным сюрпризом стало то, что и Middle, и Senior тратят около 60% рабочего времени на работу руками — код и
📌 Принесли запись трансляции27 мая Альберт Акопян и Коля Хохлов в прямом эфире разбирали технический репорт DeepseekV4.О чём говорили:00:00:33 Введение и общий обзор00:09:48 Ключевые архитектурные инновации00:31:06 Детали механизма Attention и оптимизации00:41:24 Обучение и инфраструктура01:09:36 Посттренинг, дистилляция и тонкая настройка01:16:48 Работа с низкой точностью (FP8/FP4) и аутлайерами01:24:30 Стабильность обученияЗадавайте вопросы Коле и Альберту в комментариях к этому посту ⬇️🎥 Полностью видео смотрите на YouTube
Надеюсь, все пережили datafestовую неделю 🙂С вами Андрей Широбоков и мне удалось попасть только на часть офлайн-конференции у нас в офисе. Как всегда, было мощно: от докладов до обедов.Если не согласны — делитесь мнениями в комментариях ⬇️Но после каждого такого мероприятия у меня стабильно возникает один вопрос: офлайн-конференции — это всё ещё must-have или поросшее мхом legacy?В онлайне, кажется, выигрывает почти всё:👉 проще собрать и спикеров, и слушателей,👉 не нужно тратить время и деньги на дорогу,👉 можно пересматривать, ставить на паузу, ускорять. В субботу пару раз хотел кликнуть ⏸️ на особо интересных слайдах. Отсюда опрос.
Делимся впечатлениями: Data Fest 2026Несмотря на погоду за окном, с вами было по-настоящему тепло!Что успели за день:☑️ прослушать 15 докладов от экспертов индустрии;☑️ подвести итоги Avito ML Cup;☑️ познакомиться и пообщаться;☑️ разгадать ML-кроссворд;☑️ и отлично провести время в тёплой компании на веранде нашего офиса.За день успели сделать сотню фоток, ищите себя здесь.Если пропустили какие-то выступления или хотите пересмотреть доклады — здесь сохранили трансляцию.Спасибо всем, кто был с нами на Data Fest × AvitoTech. До новых встреч!Увидимся в последнюю субботу весны через год! ❤️
Стартовал Data Fest 2026 by AvitoTech!Подключиться к трансляции:🚀Основной трек🔵смотреть в VK📺смотреть на Youtube 💻Соревновательный трек(начало в 12:00!)🔵смотреть в VK📺смотреть на Youtube
Как объединить несколько целей в один скорПривет! В прошлый раз мы разобрали Multi-task learning и в конце я остановился на том, что модель выдаёт несколько скоров, а сортировать выдачу нужно по одному числу. Сегодня разберём, как его собрать.Этот шаг называется Multi-Task Fusion (MTF): он собирает в финальный скор несколько предсказаний, например pCTR, pCVR, ожидаемое время просмотра и вероятность лайка.Самый простой вариант — формула с весамиНапример: score = w1·pCTR + w2·pCVR + w3·watch_time, где веса подбирают вручную — похожим образом сделали в статье про YouTube из прошлого поста.Но возникают три проблемы:1. Параметров много, и перебирать их в A/B долго и дорого.2. Веса одинаковы для всех, хотя оптимальный баланс у всех разный.3. Мы оптимизируем сиюминутный клик, а не то, вернётся ли пользователь завтра.Дальше исследования по очереди решают эти проблемы и по пути находят новые.Пусть веса подбирает RL, а не человекBatchRL-MTF (Tencent, KDD 2022) — одна из немногих работ, где к фьюжну успешно применили обучение с подкреплением вместо ручного подбора весов. Сессия рассматривается как MDP: в состоянии лежат признаки пользователя, действие задаёт веса фьюжна, а награда отражает долгосрочное удовлетворение.Политику учат по логам в офлайне, а параллельно понемногу пробуют новые веса на трафике. Главное ограничение: в состоянии только пользователь, без контекста и товаров.Внедрено в Tencent на коротких видео.UnifiedRL (Tencent, 2024) — здесь улучшают сам процесс обучения. Чтобы не доверять оценкам для неопробованных весов, offline RL держится близко к логам, и улучшается слабо. А поиск новых весов на трафике обычным шумным способом идёт медленно и портит выдачу.UnifiedRL делает его намного эффективнее: пробует веса в узком персональном коридоре вокруг текущей политики. Зная его границы, модель безопасно ослабляет жёсткое ограничение и и свободнее исследует новые веса.На A/B-тесте дало +4.64% полезных просмотров и +1.74% времени в приложении.EnhancedRL (Tencent, 2024)
К старту приготовитьсяНапоминаем, что через час ждём вас на ML reading club. Николай Хохлов и Альберт Акопян разберут и обсудят технический репорт DeepseekV4. Узнаем, какие проблемы возникли у команды DeepSeek в Pretrain и как с этими сложностями удалось разобраться.📌 Эфир пройдёт сегодня в 18:30🔗 Ссылка на подключение в Контур ТолкПриходите, ждём всех! 🤗
А вы уже зарегистрировались на Дата Фест в Авито?Приглашаем всех желающих послушать доклады об ML и LLM, а также понетворкать и приятно провести время.Напомним🗓 30 мая в 11 утра,📍Московский офис Авито.Расписание докладов и активностей на второй карточке поста ⬆️Зарегистрироваться можно до вечера 27 мая.
Кто же лидирует в соревнованииВсем привет! На связи Данила Бочарников, DS-инженер команды поискового ранжирования в Авито. Сегодняшний тезис: мы живём в трансформирующую эпоху с интересным соревнованием в ИИ.📃 Отчёт AnthropicКомпания опубликовала доклад, в котором написала, что США могут занять лидирующие позиции в ИИ. По их оценкам, к 2028 году получится создать «страну гениев» внутри дата-центра. В оппоненты записали Китай.Ключевые тезисы про сравнение с Китаем:🟢DeepSeek обучила модель на санкционных чипах.🟢Другие компании обходят ограничения через обучение моделей в дата-центрах Юго-Восточной Азии.🟢Ответы моделей собирают и дистиллируют с помощью фейковых аккаунтов.Текущий разрыв оценивают в 6 месяцев, и если ужесточить ограничения, США смогут оторваться сильнее. В альтернативном сценарии Китай заберёт себе рынки развивающихся стран за счёт дешевизны.Отчёт⭐ Звёздное пополнениеAnthropic продолжают собирать таланты. Недавно к ним присоединился герой одного из наших прошлых постов — Андрей Карпаты. Забавно, что он стоял у истоков OpenAI, но выбрал конкурента. Его мнение: ближайшие годы будут решающими в ИИ.Твит Карпаты🇨🇳 Ещё один кодовый агентПока американцы думают, как оторваться от остальных, китайцы продолжают погоню. DeepSeek набирает команду для создания своего кодового агента, чтобы конкурировать с Claude, Codex и Cursor.ТвитОпрос: кто будет лидировать в гонке?👌 — США🐳 — КитайПишите своё мнение в комментариях!