Data Analysis / Big Data

Data Analysis / Big Data

@big_data_analysis

Лучшие посты по анализу данных и работе с Big Data на русском и английском языке Разместить рекламу: @tproger_sales_bot Правила общения: https://tprg.ru/rules Другие каналы: @tproger_channels

2 740подписчиков
mixed

Похожие каналы

Все →

Последние посты

Data Analysis / Big Data — пост в ТГ канале

Таблицы для аналитиков в 2026-м: Яндекс 360, Р7 и Google SheetsВопрос инструмента для совместной работы с данными стал сложнее: рынок офисных редакторов за последние год-два заметно перестроился. Появились новые ИИ-возможности прямо в интерфейсе таблиц, изменились условия по on-prem развёртыванию, а доступность облачных сервисов для российских команд остаётся нестабильной.В полном разборе сравниваются три актуальных варианта по форматам, совместной работе, ИИ-ассистентам и интеграциям с аналитическим стеком (BigQuery, gspread, API). Удобно, что авторы свели всё в одну таблицу сравнения.Читать полный разбор.

3 мая 2026 г.1 920В Telegram
Data Analysis / Big Data — пост в ТГ канале

Чем занимается аналитик данных — открытый урок по Python и SQL Приглашаем вас на открытый онлайн-урок Нового технологического университета, где вы увидите, как аналитики работают с данными в реальных задачах.На занятии вы:➡️ поймете, кто такой аналитик данных и чем он занимается➡️ выполните две практические задачи на Python и SQL, даже если ни разу этого не делали➡️ разберетесь, стоит ли идти в профессию сейчас, и что будет с рынком IT через 1-3-5 лет➡️ поймете, как стать аналитиком данных в 2026, даже если вы еще учитесь в ВУЗеУрок подойдет, даже если у вас нет опыта в программировании или аналитике.Спикер — Ева Панкратова, руководитель продуктовой аналитики в М2, ex-Райффайзенбанк.Занятие пройдет онлайн, участие бесплатное. Сразу после регистрации вы получите бонус: сборник идей для портфолио.→ Регистрируйтесь: ссылкаЭто #партнёрский пост

31 мар. 2026 г.2 700В Telegram
Data Analysis / Big Data — пост в ТГ канале

Как структура данных диктует стиль кода в SQL и pandasВ аналитике часто кажется, что выбор между оконной функцией и GROUP BY — дело случая. Но исследование решений реальных задач показывает чёткую закономерность: тип данных предопределяет преобладающие конструкции.Временные ряды и задачи типа «самый высокий результат за день» почти всегда приводят к оконным функциям (RANK, LAG). Когда метрика собирается из нескольких таблиц (факты и измерения) — доминируют JOIN + GROUP BY. Задачи на исключения («кто никогда не совершал действие») — это анти-джойны (NOT EXISTS или ~isin). В pandas аналогично: .merge() появляется там, где нужно скомбинировать данные, а .groupby() — на следующем шаге.Понимание этих паттернов позволяет не гадать, а сразу выбирать нужный инструмент, ускоряя написание и отладку кода. Подробности в статье: https://www.kdnuggets.com/visualizing-patterns-in-solutions-how-data-structure-affects-coding-style

31 мар. 2026 г.2 020В Telegram
Data Analysis / Big Data — пост в ТГ канале

Победителями премии Тпрогер 🐀становятся...Здесь играет барабанная дробь и интригующая музыка... Вам нужно только выждать драматическую паузу перед объявлением победителей — в каждой номинации он один, и определяется большинством голосов. Готовы?В номинации «Продукт года» золотая мышь достается компании:🐀NetVision за платформу интеллектуального мониторинга СИМ.В номинации «Облачный продукт года» побеждает компания:🐀Гравитон с паком виртуализации «Гелиус»Звание «IT-ивент года» вручается компании:🐀Островок! за О!ХакатонИ в категории «Дизайн года» первое место занимает компания:🐀AcademiaDev за интерактивную инсталляцию.Каждый ваш лайк, голос влияли на исход премии. Давайте поддержим всех — ставьте 🏆участникам, которые хоть и не заняли призового места, но точно остались в сердечке.И 🔥, если хотите аналогичных активностей и готовы выбирать еще!

5 мар. 2026 г.874В Telegram
Data Analysis / Big Data — пост в ТГ канале

Победителями премии Тпрогер 🐀становятся...Здесь играет барабанная дробь и интригующая музыка... Вам нужно только выждать драматическую паузу перед объявлением победителей — в каждой номинации он один, и определяется большинством голосов. Готовы?В номинации «Продукт года» золотая мышь достается компании:🐀NetVision за платформу интеллектуального мониторинга СИМ.В номинации «Облачный продукт года» побеждает компания:🐀Гравитон с паком виртуализации «Гелиус»Звание «IT-ивент года» вручается компании:🐀Островок! за О!ХакатонИ в категории «Дизайн года» первое место занимает компания:🐀AcademiaDev за интерактивную инсталляцию.Каждый ваш лайк, голос влияли на исход премии. Давайте поддержим всех — ставьте 🏆участникам, которые хоть и не заняли призового места, но точно остались в сердечке.И 🔥, если хотите аналогичных активностей и готовы выбирать еще!

5 мар. 2026 г.551В Telegram

Ну и еще немного про ИИ! 😁Одни компании недолюбливают нейросети за риск утечки конфиденциальной информации. Судя по комменту к предыдущему посту вы тоже от него устали 🤪 Но каким-то образом у разных компаний получается приручить эту химеру и выуживать из нее пользу.Как, например, у этих ребят. Команда хотела облегчить работу коллег и создала то, что стало ключом к корпоративному ИИ. Они хотели доступ к мощным нейросетям, но так, чтобы ни байта данных не вышло за порог компании. И чтобы запускал это не только технарь, но и обычный менеджер.Главный стоппер был предсказуем: как заставить прожорливые модели стабильно работать в облаке под нагрузкой? Решение оказалось элегантным.Это девятый артефакт — для тех, кто побаивается нейросетей, но явно на них облизывается. Покажите вашему начальнику, скажите, что все не так страшно 👻

10 февр. 2026 г.994В Telegram
Data Analysis / Big Data — пост в ТГ канале

⚪️ Артефакт №2. Категория «Дизайн» ⚪️Дашборд — это скучно до того момента, пока к его визуализации не подключат гигантский экран.Сегодняшняя история о команде, которая превратила обычную статистику посещения фестиваля в генеративное шоу. Их задача звучала как вызов: сделать так, чтобы было невозможно оторвать глаз от дашбордов.Так они создали интерактивную инсталляцию, где посетители, сами того не зная, становились частью цифрового арт-объекта.🤩 Что скрывает этот артефакт? 🤩🤩 Способ связки 40 потоков с YOLO v8, PostgreSQL и движок визуализации без лагов в один конвейер.🤩 Задачу дедубликации тысяч JSON-записей от нейросетей.🤩 Борьбу с «сырыми» данными от камер и их преобразование в чистую структуру для базы и красивого рендера.Следующий артефакт представит категорию «Виртуализация». Не пропустите.

29 янв. 2026 г.1 430В Telegram
Data Analysis / Big Data — пост в ТГ канале

🔄 Артефакт №1. Категория: «Город» 🔄От кого только не прилетает самокатчикам. Иногда за дело, иногда нет. Не нам судить, но мы обсудим, что делать, например, с явными нарушителями? Как их контролировать, если операторы кикшеринга не пускают в свои данные? Закрывать глаза на хаос на тротуарах или тотально запрещать?Мы получили кейс, где за 4 месяца команда из 7 человек создала платформу мониторинга, которая фиксирует самокатовские нарушения. Их задачей было сделать инструмент для структурирования данных, чтобы чиновники и операторы нашли общий язык.🤩 Что скрывает этот артефакт? 🤩🤩 Смекалистый метод охоты за данными, когда реальные видео с камер недоступны.🤩 Принципы, которые помогли сделать мониторинг более объективным.🤩 Гибридный R&D: тактика, которая помогла запустить MVP за четыре месяца, вместо шести.Планируем поделиться с вами целой пачкой интересных артефактов. Ставьте 👀, если любопытно узнать их все.

28 янв. 2026 г.698В Telegram

Сравнительный обзор механизмов polling в Kafka и Pub/Sub в RabbitMQ: особенности и области примененияДрузья, привет! Меня зовут Андрей Комягин, я CTO компании STM Labs. Мы занимаемся разработкой очень больших распределённых высоконагруженных систем для различных отраслей, включая налоговое администрирование, телеком, track & trace и многие другие. В своих проектах и архитектурах мы широко применяем open-source-решения, включая брокеры сообщений, такие как Kafka и RabbitMQ.Совсем недавно я выступил на конференции HighLoad++ Genesis 2025: рассказал про анатомию каждого из этих брокеров, сравнил их по набору критериев и оценил результаты их нагрузочного тестирования. А теперь решил выпустить этот материал в виде статьи в блоге, чтобы читатели Хабра тоже смогли изучить нюансы и понять, на какие задачи заточен каждый из брокеров. Итак, поехали!О брокере Apache Kafka я очень подробно рассказал в своей предыдущей статье. Повторяться и снова разбирать его сегодня я не буду — вы можете перейти по ссылке выше и ознакомиться с материалом, а затем вернуться сюда.Читать: https://habr.com/ru/articles/989590/#ru@big_data_analysis | Другие наши каналы

27 янв. 2026 г.586В Telegram

Устраиваем свой Data QA с PyTest и фикстурамиРабочий подход к тестированию трансформации данных в ETL-процессах. На примере Python-проекта с pytest, allure и psycopg2 демонстрируется, как автоматизировать создание и наполнение таблиц, хранить схемы и данные, а затем сравнивать результат. Читать: «Устраиваем свой Data QA с PyTest и фикстурами»#ru@big_data_analysis | Другие наши каналы

27 янв. 2026 г.487В Telegram

10 библиотек Python, которые меняют карьеру10 библиотек Python, которые помогут прокачаться в аналитике, ML и разработке. Как они работают и почему меняют карьеру.Читать: «10 библиотек Python, которые меняют карьеру»#ru@big_data_analysis | Другие наши каналы

27 янв. 2026 г.388В Telegram

Язык Julia: что это и почему он популярен в научных вычисленияхЧто такое язык Julia. Показываем сравнение языка Джулия с другими. Рассматриваем преимущества и основные нюансы ✔ TprogerЧитать: «Язык Julia: что это и почему он популярен в научных вычислениях»#ru@big_data_analysis | Другие наши каналы

27 янв. 2026 г.368В Telegram