Библиотека дата-сайентиста | Data Science, Machine learning, анализ данных, машинное обучение

@dsproglib

Все самое полезное для дата сайентиста в одном канале.Учиться у нас: clc.to/6qVHggПо рекламе: @proglib_advДля обратной связи: @proglibrary_feeedback_botРКН: https://gosuslugi.ru/snet/67a5b03124c8ba6dcaa121c9

18 453подписчиков

Ежедневно🇷🇺

Открыть в Telegram

Последние посты

💡 Почему bias двигает границу решения — на примере перцептронаПерцептрон знают все: output = (w · x + b) > 0. Но один нюанс часто проскакивает мимо — почему bias обязателен, даже когда кажется что веса должны справиться сами.Задача: классифицировать оценку студента (прошёл / не прошёл, граница на 50)Без bias формула — это просто weight * score. Все входные данные положительные (оценки от 0 до 100). Если вес положительный — модель скажет «прошёл» всем. Если отрицательный — всем «не прошёл». Граница решения навечно прибита к нулю.Формула границы:decision_boundary = -bias / weightБез bias числитель всегда 0 — границу невозможно сдвинуть с нуля никаким значением weight. Обучение застревает на 48-50% accuracy и дальше не двигается, сколько эпох ни гоняй.С bias — то же самое обучение доезжает до 100% и граница сама находит нужную точку (50).✔️ Практический выводЕсли входные данные не центрированы вокруг нуля — bias не опция, а необходимость. Без него модель геометрически не может провести границу там где нужно, независимо от количества итераций или learning rate.Полный код для случая «is this number positive»import randomlearning_rate = 0.1EPOCHS = 100weight = random.uniform(-1, 1)bias = random.uniform(-1, 1)data = [(i * 0.1, True) for i in range(1, 501)]data += [(i * 0.1, False) for i in range(-500, 0)]random.shuffle(data)for epoch in range(EPOCHS): for value, result in data: prediction = (weight * value + bias) > 0 if prediction != result: error = result - prediction weight += learning_rate * error * value bias += learning_rate * errorКлассная статья с интерактивом📍 Навигация: Вакансии • Задачи • СобесыБиблиотека дата-сайентиста #буст

18 июн. 2026 г.931В Telegram

TS-ICL: foundation model для временных рядовEDF Lab выпустили TS-ICL — модель для временных рядов в zero-shot режиме, которая решает сразу две задачи: forecasting и imputation.Современные TSFM вроде Chronos-2 хорошо прогнозируют, но плохо справляются с восстановлением пропущенных значений. Табличные foundation-модели (TabPFN-TS, TabICL-TS) умеют и то и другое, но дорогие в инференсе и не учитывают специфику временных рядов.TS-ICL пытается закрыть этот разрыв.➡️ Как работает модельЭто вероятностный time-continuous Transformer, обученный через in-context learning на реальных данных и синтетических причинных priors. Задачи формулируются как регрессия с привязкой к временным меткам, что даёт модели возможность:— прогнозировать будущие значения— восстанавливать пропуски — критично для мониторинга сенсоров, реконструкции исторических данных, поиска аномалий— учитывать ковариаты без переобучения— работать с нерегулярными и частично наблюдаемыми рядами➡️ РезультатыНа бенчмарках TS-ICL показывает state-of-the-art в zero-shot imputation и держится на уровне ведущих forecasting-моделей. Особенно заметно преимущество когда нужно прогнозировать на основе неполной истории.Веса модели открыты, есть pip-устанавливаемый пакет — можно сразу пробовать на своих данных.📍 Навигация: Вакансии • Задачи • СобесыБиблиотека дата-сайентиста #буст

18 июн. 2026 г.973В Telegram

⏰ Уже сегодня в 19:00 (МСК) стартует открытый урок!Тема:«Мультиагентные системы: почему большинство архитектур переусложнены»🔥 За 90 минут разберёмся, когда действительно стоит строить мультиагентную систему, а когда она только добавляет сложность, расходы и новые точки отказа.Поговорим о критериях выбора архитектуры, типичных ошибках и ограничениях современных ИИ-агентов, которые важно учитывать ещё до внедрения в продукт.🎙️ Спикер — Дмитрий Юдин, руководитель AI/ML-направления в Сloud․ru.🎁 Для всех участников подготовили промокод на скидку 10 000 ₽ на курс «Разработка ИИ-агентов».👉 Успей присоединиться к уроку

18 июн. 2026 г.1 170В Telegram

Библиотека дата-сайентиста | Data Science, Machine learning, анализ данных, машинное обучение — пост в ТГ канале

🚀 Семантическая vs Экземплярная vs Паноптическая сегментация: разбираемся раз и навсегдаВ компьютерном зрении есть три основных подхода к сегментации изображений. Новички часто в них путаются, а ведь разница между ними принципиальная — как в архитектуре моделей, так и в финальных метриках.📍 Навигация: Вакансии • Задачи • СобесыБиблиотека дата-сайентиста #буст

17 июн. 2026 г.1 270В Telegram

➡️ Визуализация градиентного спускаНебольшой эксперимент чтобы наглядно увидеть как SGD, Momentum, RMSProp и Adam ведут себя в разных «долинах». 🔥 Написано с нуля на JS, без ML-библиотек.Особенно интересно смотреть на Rosenbrock — узкая изогнутая долина хорошо показывает почему обычный SGD застревает, а Momentum и Adam справляются заметно быстрее.Попробовать📍 Навигация: Вакансии • Задачи • СобесыБиблиотека дата-сайентиста #буст

17 июн. 2026 г.1 380В Telegram

👀 Библиотека дата-сайентиста #развлекалово

16 июн. 2026 г.1 410В Telegram

🍀 scikit-learn 1.9 — что новогоРелиз без громких новых алгоритмов, но с заметной консолидацией.❇️ Callbacks — новый механизм мониторингаЭкспериментальная фича: теперь можно отслеживать прогресс обучения, делать early stopping, выводить progress bar — не дожидаясь окончания .fit().from sklearn.linear_model import LogisticRegressionfrom sklearn.callback import ProgressBarclf = LogisticRegression(solver="lbfgs")clf.fit(X, y, callback=ProgressBar())Пока поддерживается в LogisticRegression (LBFGS), *SearchCV, Pipeline и StandardScaler. Дальше будет больше.❇️ Что добавили в существующие модели— RandomForestRegressor теперь умеет работать с пропущенными значениями при критерии absolute error— monotonic constraints в деревьях теперь поддерживают missing values— LogisticRegression работает с float32 напрямую — меньше памяти— sample weights в HistGradientBoosting, RandomForest, ExtraTree стали статистически корректнее— RidgeCV и RidgeClassifierCV — быстрее и стабильнее❇️ GPU-поддержка расширяетсяЧерез Array API теперь на GPU можно гонять:— LogisticRegression и PoissonRegressor с LBFGS— больше метрик (average precision score и другие)— Nystroem kernel approximationОпыт работы с GPU backend пока не идеален по сравнению с обычным numpy — но направление развивается.❇️ Удобство в JupyterHTML-визуализация estimator'ов теперь показывает fitted attributes по клику, а ColumnTransformer наглядно показывает как собираются фичи.pip install -U scikit-learn📍 Навигация: Вакансии • Задачи • СобесыБиблиотека дата-сайентиста #свежак

16 июн. 2026 г.1 400В Telegram

RAG from scratch: разбираемся в деталяхБазовый RAG понятен: чанки → эмбеддинги → retrieval → generation. Но между «понял концепцию» и «работает в проде» — пропасть.LangChain выпустили серию «RAG from scratch» — ноутбуки с видео которые разбирают не только основы, но и то где обычно всё ломается.🖥 Ссылка на ресурс📍 Навигация: Вакансии • Задачи • СобесыБиблиотека дата-сайентиста #буст

15 июн. 2026 г.1 520В Telegram

💪 Paca: проджект-менеджмент для AIJira даёт бэклог. ClickUp даёт автоматизации. Monday даёт дашборды. Все они добавляют AI как чатбот сбоку.Paca идёт дальше: AI агент получает место в Scrum-команде наравне с людьми.В Paca агент не отвечает на вопросы — он участвует в процессе:— появляется на Scrumban-доске рядом с людьми— берёт задачи из бэклога и обновляет статус в реальном времени— помогает писать BDD-спецификации и Gherkin-сценарии— участвует в System Design — архитектура видна всей командеПри этом:— Self-hosted: данные остаются у вас— Бесплатно и open-source (Apache 2.0)— MCP Server из коробки — подключается к Claude, Cursor и другим агентам— Claude Code Skill — агент знает как работать с Paca— Полностью конфигурируемый через плагины📍 Навигация: Вакансии • Задачи • СобесыБиблиотека дата-сайентиста #буст

14 июн. 2026 г.1 440В Telegram

а что выбираешь ты 😁Библиотека дата-сайентиста #развлекалово

14 июн. 2026 г.1 330В Telegram

CVPR 2026: 16 000 заявок, 4 090 принято. Вот 5, которые стоит прочитать первымиЕсли вы работаете с VLM или мультимодальными пайплайнами — это ваш список на длинные выходные.1. SAM 3D — лучшая работа конференции«Сегментируй что угодно» теперь в 3D из одного 2D изображения, за один проход. Год назад это назвали бы исследовательским демо.2. Back to Basics — Tianhong Li & Kaiming HeКогда Каiming He публикует «Назад к основам» — читаешь сразу. Оба предыдущих раза он переписывал то, что область считала устоявшимся.3. TIPSv2 — vision-language pretraining с улучшенным patch-text alignmentПоиск на уровне патчей — это следующее поколение image RAG.4. INSID3 — сегментация по примерам без обучения, на DINOv3Никакого файн-тюнинга, никаких меток, oral на CVPR. Training-free подход — тренд, которому долго сопротивлялось.5. A Frame is Worth One Token — дельта-токены для генеративного моделирования мираТокенная эффективность которая изменила LLM-инференс теперь добралась до видео.📍 Навигация: Вакансии • Задачи • СобесыБиблиотека дата-сайентиста #буст

11 июн. 2026 г.1 060В Telegram

PyTorch custom operations: когда стандартных слоёв не хватаетИногда нужна операция, которой нет в PyTorch из коробки. Можно написать её на Python, но если нужна скорость — пишут на C++ и CUDA. Разбираем как это устроено.Два способа расширить PyTorch1. Custom function — stateless операцияРеализуется на C++/CUDA, регистрируется через TORCH_LIBRARY_IMPL. PyTorch сам выбирает CPU или CUDA реализацию в зависимости от устройства тензора:# После загрузки .so файлаresult = torch.ops.my_ops.identity_conv_op(tensor)2. Custom class — операция с состояниемЕсли нужно хранить параметры (веса, конфиг) — используют torch::CustomClassHolder. Класс регистрируется и становится доступен из Python:conv = torch.classes.my_ops.IdentityConvClass(channels=3)output = conv.forward(input_tensor)Главная сложность — torch.exportКогда модель компилируется для продакшена через torch.export, трассировщик работает с «фейковыми» тензорами — он не запускает реальный C++ код. Поэтому нужно зарегистрировать абстрактную Python-версию каждой операции:@torch.library.register_fake("my_ops::identity_conv_op")def _fake(x: torch.Tensor) -> torch.Tensor: return torch.empty_like(x) # только форма и тип, без вычисленийЧто в итогеСкомпилированная модель (.pt2 файл) запускается и из Python, и из чистого C++ без зависимости от libpython — удобно для деплоя в продакшен без Python окружения.Схема работы:C++/CUDA код → .so библиотека → регистрация в PyTorch ↓torch.export → AOTInductor → model.pt2 ↓Python inference или C++ inference (dlopen)Полный пример с Identity Convolution📍 Навигация: Вакансии • Задачи • СобесыБиблиотека дата-сайентиста #буст

11 июн. 2026 г.1 080В Telegram

✳️Шпаргалка: рабочая станция для AI/ML в 2026Больше не нужен огромный бюджет на облако. Консьюмерское железо и open-source модели изменили правила. Но покупать нужно стратегически.🖥 Железо: смотрите на VRAM, не на CPUGPU (RTX 5090):— лучший выбор для дообучения тяжёлых моделей— CUDA незаменима для full fine-tuning— дорого, шумно, энергозатратноNPU + unified memory (Apple M5 Max, Intel Panther Lake):— 64–128 ГБ RAM → большая часть уходит под VRAM— 70B+ моделей локально без облака— тихо, эффективно, достаточно для большинства DS-задачПравило: для инференса и экспериментов — unified memory. Для обучения с нуля — GPU.📦 Локальные модели: уходите от API-зависимостиЛучшие модели для локального запуска в 2026:— DeepSeek V4 — сильный reasoning, хорош для кода— Qwen3-Coder — отличный выбор для задач с данными— Llama 3.3 — универсальный вариантЗапуск через Ollama:ollama run qwen3-coderollama run deepseek-v4Квантизация — ключевое понятие:Q8 — максимальное качество, нужно много VRAMQ4 — баланс качества и размера (рекомендуется)Q3 — минимум VRAM, качество падает заметно🔍 Как выбрать модель для задачи— Анализ данных, код → Qwen3-Coder, DeepSeek V4— Длинный контекст, документы → Gemini 3.1 Pro— Сложные агентные задачи → Claude Opus 4.7— Быстрый инференс локально → Llama 3.3 Q4Ориентир для сравнения моделей на реальных задачах с кодом — SWE-bench.⚙️ Минимальный стек для стартаOllama — локальный запуск моделейLM Studio — GUI для экспериментовLangChain — оркестрация агентовChromaDB — локальная векторная БД для RAG💡 Правило выбора— Чувствительные данные → только локально— Разовые тяжёлые задачи → API— Повторяющиеся задачи → локально, окупается быстро📍 Навигация: Вакансии • Задачи • СобесыБиблиотека дата-сайентиста #буст

10 июн. 2026 г.1 110В Telegram

🌳 SuperTree — интерактивная визуализация деревьев решений прямо в Jupyter NotebookЕсли вы работаете с деревьями решений и ансамблями, то наверняка сталкивались с тем, что стандартные визуализации быстро становятся неудобными для анализа.SuperTree решает эту проблему, добавляя полноценную интерактивность:✅ Масштабирование и навигация по дереву✅ Сворачивание и разворачивание узлов✅ Отслеживание пути конкретного объекта через дерево✅ Работа прямо в Jupyter Notebook, JupyterLab и Google ColabУстановка:pip install supertreeПример использования:from sklearn.tree import DecisionTreeClassifierfrom sklearn.datasets import load_irisfrom supertree import SuperTreeiris = load_iris()model = DecisionTreeClassifier(max_depth=3)model.fit(iris.data, iris.target)super_tree = SuperTree( model, iris.data, iris.target, iris.feature_names, iris.target_names)super_tree.show_tree()📍 Навигация: Вакансии • Задачи • СобесыБиблиотека дата-сайентиста #буст

9 июн. 2026 г.1 330В Telegram

🧠 Google представила Memory-Cached RNN — возможного конкурента TransformersПоследние 7 лет практически все крупные языковые модели — ChatGPT, Claude, Gemini, Llama — строились на архитектуре Transformer. Несмотря на впечатляющие результаты, у неё есть фундаментальная проблема: вычислительная сложность внимания растёт квадратично относительно длины контекста.До появления Transformers основой многих нейросетей были RNN (Recurrent Neural Networks). Они обрабатывают последовательности намного эффективнее, но страдают от другой проблемы — ограниченной памяти. При работе с длинными текстами модель постепенно «забывает» информацию из начала последовательности.Исследователи Google предложили новый подход в работе «Memory Caching: RNNs with Growing Memory».💡 Ключевая идея — добавить RNN механизм кэширования промежуточных состояний.Вместо фиксированной памяти модель сохраняет важные «снимки» своего внутреннего состояния по мере чтения текста. По мере роста последовательности память также может расширяться. Что это даёт:• память растёт вместе с длиной контекста;• вычислительная стоимость остаётся значительно ниже, чем у Transformer;• улучшается работа с длинными документами и задачами на запоминание;• достигается качество, близкое к Transformer, без квадратичного роста вычислений.🚀 Если результаты подтвердятся на больших языковых моделях промышленного масштаба, в ближайшие годы мы можем увидеть новый класс архитектур, где память растёт динамически, а вычисления остаются линейными по длине последовательности.📍 Навигация: Вакансии • Задачи • СобесыБиблиотека дата-сайентиста #буст

9 июн. 2026 г.1 350В Telegram

Библиотека дата-сайентиста #развлекалово

8 июн. 2026 г.1 380В Telegram

🖼️ Как работает сжатие изображений: взгляд Data ScientistДля дата-сайентиста изображение — это не картинка, а матрица чисел. Сжатие же изображений позволяет уменьшить объём данных, сохранив максимум полезной информации.Классный гид для быстрого понимания темы📍 Навигация: Вакансии • Задачи • СобесыБиблиотека дата-сайентиста #буст

8 июн. 2026 г.1 450В Telegram

🔥 Инженерная методичка по ИИ от Романа Барлоса (Team Lead в Yandex Cloud)Продолжаем делиться экспертизой команды курса «Разработка ИИ-агентов».Роман собрал мастхев-инструменты и ключевые работы для тех, кто хочет выйти за рамки вайбкодинга.🛠️ Полезные инструменты:• Understand Anything — граф знаний по коду и зависимостям.• DeepTutor — open-source платформа для персонализированного обучения.• Superpowers — набор практик для системной разработки с ИИ.• Awesome Agent Skills — коллекция навыков для ИИ-агентов.📚 Ключевые работы по LLM:• Attention Is All You Need (2017) — архитектура Transformer.• GPT-1 (2018) — начало эпохи GPT.• GPT-2 (2019) — решение новых задач без дообучения.• GPT-3 (2020) — обучение на примерах из запроса.• InstructGPT (2022) — RLHF и современные чат-боты.На курсе Роман выступает консультантом программы: помогает формировать содержание уроков с опорой на актуальные инженерные практики».Занять свое место на потоке:👉 Курс «Разработка ИИ-агентов»

8 июн. 2026 г.1 450В Telegram

🤖 Материалы: Awesome Self-Evolving AgentsПодборка материалов про самоэволюционирующих AI-агентов и их развитие в последние годы.Проект систематизирует исследования в области agentic AI и разбивает их на понятную структуру эволюции методов📍 Навигация: Вакансии • Задачи • Собесы📍 Как внедрять AI-логику в бэкенд и сохранять стабильность сервиса#буст

7 июн. 2026 г.1 420В Telegram

🖼️ Как CNN «видят» изображенияСверточные нейронные сети (CNN) лежат в основе множества задач компьютерного зрения — от классификации изображений до детекции объектов и сегментации.📍 Навигация: Вакансии • Задачи • СобесыБиблиотека дата-сайентиста #буст🖼️ Как CNN «видят» изображенияСверточные нейронные сети (CNN) лежат в основе множества задач компьютерного зрения — от классификации изображений до детекции объектов и сегментации.📍 Навигация: Вакансии • Задачи • СобесыБиблиотека дата-сайентиста #буст

7 июн. 2026 г.1 380В Telegram

Библиотека дата-сайентиста | Data Science, Machine learning, анализ данных, машинное обучение

Похожие каналы

Последние посты