Machinelearning

Machinelearning

@ai_machinelearning_big_data

Погружаемся в машинное обучение и Data ScienceПоказываем как запускать любые LLm на пальцах. По всем вопросам - @haarrp@itchannels_telegram -🔥best channelsРеестр РКН: clck.ru/3Fmqri

293 613подписчиков
Ежедневно🇷🇺

Похожие каналы

Все →

Последние посты

✔️ Exa запустила агентную платформу для веб-поиска и парсинга данныхКомпания открыла доступ к Agent API, инструменту для ресёрча и обогащения данных из интернета. По словам Exa, выполнение задач обходится вдвое дешевле по сравнению с GPT 5.5 и Claude Opus.Платформа работает на базе собственного движка, LLM и алгоритма извлечения текста Highlights. При парсинге объемных данных система разбивает процесс на подзадачи и запускает субагентов для параллельного сканирования доменов. В ходе поиска Agent API маршрутизирует запросы между разными моделями в зависимости от сложности, а алгоритм Highlights собирает только целевые фрагменты страниц. Механизм снижает расход токенов на 94%. В профильном бенчмарке WideSearch инструмент обошел Perplexity Agent по метрике row-level F1.API поддерживает кастомные JSON-шаблоны для вывода структурированных таблиц и загрузку пользовательских списков для автозаполнения недостающих данных. В тарифной сетке доступно несколько режимов: базовый стоит $0,012 за запрос, стандартный - $0,10, максимальный - $1. Плюс есть автоматический режим балансировки нагрузки.@ai_machinelearning_big_data#news #ai #ml

21 июн. 2026 г.17 500В Telegram
Machinelearning — пост в ТГ канале

✔️ Бывший советник по ИИ Белого Дома возглавит новую команду в OpenAIАналитик Дин Болл рассказал в личном блоге, что в начале июля присоединится к OpenAI на должность главы Strategic Futures, нового подразделения, которое займётся вопросами политики в сфере ИИ.Strategic Futures - небольшая команда с высокой степенью самостоятельности, которая будет подчиняться директору по стратегии OpenAI Джейсону Квону.В сферу её ответственности он включает катастрофические риски, рекурсивное самоулучшение моделей, влияние ИИ на рынок труда, а также отношения между ИИ-лабораториями, государствами и обществом.Экспертиза в ML или политике в сфере ИИ при этом не обязательна, Дин рассчитывает собрать команду из представителей разных дисциплин и сейчас открыт к обращениям кандидатов.Ранее Болл работал в Белом доме, где занимался вопросами политики в области ИИ. Своё решение перейти в OpenAI он объясняет собственными представлениями об управлении передовыми технологиями.ИИ нуждается в регулировании, но одновременно сам становится новым инструментом управления, а наиболее значимые решения в этой области, вероятно, будут приниматься внутри лабораторий, а не внешними институтами.Чтобы вести содержательную работу по политике ИИ, технологию необходимо понимать изнутри.@ai_machinelearning_big_data#news #ai #ml

20 июн. 2026 г.18 900В Telegram

✔️ В macOS-клиенте Codex появилась возможность создания сценариевOpenAI добавила функцию Record and Replay в Codex для автоматизации десктопной рутины. Инструмент записывает повторяющиеся действия пользователя и конвертирует их в структурированный алгоритм.Пользователь вручную управляет процессом записи. После захвата действий модель генерирует редактируемый сценарий. Его можно сохранить для запуска в будущем.Пока функция работает в виде опциональной настройки только в клиенте для macOS. Для её использования требуется активировать специальное разрешение Computer Use. Из-за региональных ограничений релиз недоступен на территории стран ЕЭЗ, Великобритании и Швейцарии.OpenAIDevs в сети Х✔️ Artificial Analysis запустила бенчмарк для оценки работы ИИ в бизнес-проектахТест AA-Briefcase был разработан совместно с Google, McKinsey и BCG. Он состоит из 91 задачи, симулирующей процессы в Data Science, управлении продуктами, банкинге и промышленности. Модели ранжируются по качеству аналитики, точности ответов и формату данных.Лидером рейтинга стала Fable 5, второе и третье место - Opus 4.8 и GLM-5.2. Показатели успешности остаются низкими, лидер достиг 100% результата лишь в 3% случаев и не набрал половины баллов в 31 задании. В опенсорс-сегменте GLM-5.2 уступила Opus 4.8 на 90 баллов при четырехкратной разнице в стоимости использования.Разброс цены за выполнение одной задачи составил от 4 центов у DeepSeek V4 до 31 доллара у Fable 5. Авторы бенчмарка зафиксировали, что для прохождения тестов моделям-литерам регулярно требовались инструменты визуального анализа.artificialanalysis.ai✔️ Google DeepMind на этой неделе лишилась двух ИИ-звездКоманду покинул Джон Джампер, руководитель проекта AlphaFold и лауреат Нобелевской премии по химии 2024 года. После почти 9 лет работы в подразделении он принял решение перейти в Anthropic.Джампер получил мировое признание за создание алгоритма, совершившего революцию в предсказании трехмерной структуры белков, разделив награду с Демисом Хассаб

20 июн. 2026 г.18 400В Telegram
Machinelearning — пост в ТГ канале

✔️ DeepSeek раскатал Vision Mode в чат-ботеDeepSeek запустил Vision Mode в веб-версии и мобильном приложении. Режим поддерживает визуальный CoT для сложных задач (геометрические выводы, анализ графиков и прямую конвертацию UI-скринов в HTML).В основе функции лежит работа Thinking with Visual Primitives, в которой авторы решили проблему восприятия MMLM при точной локализации и пространственных рассуждениях.Координаты и граничные рамки используются как минимальные единицы мышления и встраиваются непосредственно в визуальную цепочку CoT.Это дает модели точную пространственную ориентацию в инференсе без опоры на описания естественным языком.Vision Mode обрабатывает только статические изображения. Поддержки аудио, видео и генерации картинок нет.@ai_machinelearning_big_data#news #ai #ml

19 июн. 2026 г.21 100В Telegram
Machinelearning — пост в ТГ канале

📌 DeepMind опубликовала архитектуру безопасности AI Control RoadmapВслед за недавними размышлениями об эволюции AGI в ASI, исследовательское подразделение Google представила внутренний регламент контроля высокоразвитых ИИ-агентов.Помимо привычного элайнмента модели, DeepMind добавляет отдельный слой системного контроля, пересобирая защиту исходя из худшего сценария.За вводную берётся то, что система изначально враждебна, имеет скрытые цели и тайно работает против разработчиков.Для систематизации таких угроз взяли за основу популярный фреймворк MITRE ATT&CK и создали на его базе TRAIT&R, новую таксономию тактик и методов обхода защиты.Она учитывает специфику ИИ и описывает векторы атак, недоступные людям: от незаметного саботажа научных исследований и внедрения бэкдоров до распределенных цепочек взлома, когда фрагменты вредоносного плана синхронно выполняются сотнями разных инстансов одного агента.Защита выстроена по принципу эскалации и делится на уровни D1–D4 для систем обнаружения и R1–R3 для механизмов реагирования.На базовых этапах безопасность обеспечивается анализом CoT агента в песочницах под присмотром более слабых, но надежных ИИ-супервизоров.По мере развития способностей модели начинают понимать факт слежки и учатся скрывать ход своих мыслей.Для контроля над такими системами (это уровень D4/R3) традиционные методы больше не работают.На этом этапе DeepMind планирует применят более затратные меры, вплоть до проверки внутренних состояний модели, использования изолированных копий самой недоверенной системы для аудита и инфраструктуры экстренной остановки агентов и запущенных ими процессов.Вместе с новой стратегией опубликован отдельный документ для индустрии о том, как сделать агентов безопасными по мере их распространения, и он разбит на 3 уровня:🟡Безопасность отдельного агентаКак защитить одну систему от утечек данных, чужих манипуляций и от собственных ошибочных действий, и зачем для этого нужны общие стандарты.🟡Риски взаимодействия агентовКаскадные сбои

19 июн. 2026 г.22 400В Telegram

✔️ GPT-5.5 Instant прокачали по медицинеОбновление принесло серьезный скачок в обработке сложных запросов о здоровье. Модель, дообученная при участии двух сотен врачей, теперь справляется с бенчмарком HealthBench на уровне ризонинг-моделей компании.Алгоритм стал гораздо лучше выявлять критические симптомы, сообщать о степени своей неуверенности и запрашивать у пользователя недостающий контекст.Оптимизации уже показали эффективность на проде. Мониторинг еженедельных запросов зафиксировал падение количества ошибок на 71% за 2 месяца.openai.com✔️ Anthropic перенесла фичу Artifacts в Claude CodeЗнакомый по веб-версии чат-бота инструмент теперь позволяет генерировать интерактивные страницы прямо из консоли. В Anthropic считают, что нововведение упростит ревью пулл-реквестов, анализ инцидентов, аудит лицензий и визуализацию архитектуры.При создании дашборда учитывается весь рабочий контекст: исходный код, подключенные утилиты и история диалога. Чтобы сгенерировать артефакт, достаточно отправить соответствующий промпт в процессе работы. Все созданные материалы по умолчанию приватны и видны только авторизованным сотрудникам с учетом ролевых политик организации.Функция доступна в бете для тарифов Team и Enterprise и работает как через CLI, так и в десктопном приложении.claude.com✔️ Perplexity сделала рекурсивную память для ComputerИИ-поисковик добавил своей агентной системе Computer новую систему памяти Brain, которая работает как автоматизированная LLM-вики.Brain непрерывно фиксирует весь ход работы: структуру проектов, исходники, а также тупиковые решения и ошибки. Каждую ночь система синтезирует накопленные данные и обновляет граф контекста, избавляя от необходимости заново вводить бота в курс дела перед началом новой сессии.Perplexity заявляет о росте точности ответов на 25% и улучшении работы с контекстом на 16%. Кроме того, Brain позволяет сократить расход токенов на передачу истории диалога в среднем на 13%.Развертывание началось в статусе превью для тарифов Max и Ent

19 июн. 2026 г.19 600В Telegram
Machinelearning — пост в ТГ канале

✔️ Эстония начнет выдавать цифровые ID ИИ-агентамИнициатива по выдаче цифровых ID автономным агентам в рамках расширения программы e-residency, одобренная премьер-министром страны, определяет правовой статус алгоритмов при выполнении задач от лица компаний, госучреждений и граждан.Статус позволит ИИ легально работать с базами данных в режиме чтения, готовить документы и управлять финансами в пределах заданных лимитов. Права доступа настраиваются самим владельцем агента, но каждое действие ИИ будет записываться в аудируемый лог.Эстония уже внедряет LLM в госсектор и школы совместно с OpenAI. Премьер-министр тестирует инструменты разработки лично, недавно он навайбкодил с помощью Claude дашборд для отслеживания приоритетов кабинета министров.@ai_machinelearning_big_data#news #ai #ml

18 июн. 2026 г.21 600В Telegram
Machinelearning — пост в ТГ канале

9 июля на масштабном форуме Data Day 2026 соберутся лидеры data- и AI-команд, которые формируют подходы к работе с данными, ML и AI в ведущих компаниях РФ — Сбер, X5 Tech, Т-Банк, Ozon Fintech, Lamoda, ВТБ и другие.Свое участие уже подтвердили более 60 спикеров.«Бизнес. Техноград» на ВДНХ. 1500 участников. 5 отраслевых треков. Обсудим, как все реально устроено в системах лидеров рынка. В программе:💰 Тренды AI и данных «из первых уст». На какие технологии и подходы делают ставку лидеры рынка?💰 Как превратить хаос данных в надежный бизнес-навигатор и сделать данные стратегическим активом компании.💰 Практика внедрения AI и data-driven подходов в финтехе, ритейле, логистике, промышленности и агросекторе.💰 Как находить новые точки роста, используя опыт цифровых лидеров и сильные data-команды.💰 AI-hub: выставка и центр экспертизы готовых AI-решений и автономных агентов для бизнеса.Выступают:– Дмитрий Криволапов, Lamoda. Директор департамента по данным и аналитике.– Алексей Бондаренко, Газпромбанк. Вице-президент — начальник департамента управления данными.– Дмитрий Рузанов, Альфа-Банк. Директор департамента разработки моделей.– Павел Денисенко, X5 Tech. Директор департамента развития платформы больших данных.– Артём Летин, ВТБ. Начальник управления моделирования КИБ и СМБ, вице-президент.– Валерий Поляков, Т-Банк. Лидер по данным группы Т-Технологии (Chief Data Officer).– Александр Лукьянов, ДОМ РФ Технологии. Генеральный директор.– Валентина Рудик, Ozon Fintech. Руководитель розничного кредитования.– Андрей Скачёк, М.Видео, Директор по маркетингуИ другие. 9 июля, «Бизнес. Техноград», ВДНХ, Москва. Присоединяйтесь! Форум соберет экспертов по данным, ML и AI из банков, ритейла, телекома, транспорта, агропрома и ИТ-индустрии. 👉 Программа и регистрацияP.S. Для иногородних участников AZIMUT Отель Аэростар Москва предоставит скидку 22% на проживание по промокоду DataDay.

18 июн. 2026 г.18 800В Telegram
Machinelearning — пост в ТГ канале

⚡️ Liquid AI выпустила две retrieval-модели на 350M параметровВышли LFM2.5-Embedding-350M и LFM2.5-ColBERT-350M. Это первые двунаправленные модели в семействе LFM, сделанные на базе LFM2.5-350M-Base.Главный фокус: быстрый мультиязычный поиск для RAG, FAQ, каталогов, саппорта и баз знаний. Поддерживаются 11 языков, включая арабский, японский, корейский и европейские языки.Архитектурно Liquid взяли causal decoder и превратили его в bidirectional encoder: убрали causal mask, включили full attention и сделали короткие свёртки не-причинными. Теперь каждый токен видит контекст с двух сторон, что важно для retrieval.Разница между моделями:• LFM2.5-Embedding-350M даёт один dense vector на документ. Индекс компактный, поиск быстрый, хранение дешёвое.• LFM2.5-ColBERT-350M хранит вектор на каждый токен и использует MaxSim late interaction. Качество выше, особенно на кросс-язычном поиске, но индекс тяжелее.По NanoBEIR Multilingual:- ColBERT: 0.605 NDCG@10- Embedding: 0.577- Qwen3-Embedding-0.6B: 0.556- gte-multilingual-base: 0.528На MKQA-11 обе LFM-модели дают около 0.69 Recall@20.На H100 embedding запроса около 1.5 мс p50, ColBERT query + MaxSim около 2.5 мс p50. Есть GGUF под llama.cpp, на MacBook M4 Max около 7-8 мс p50.Релиз для тех, кому нужен дешёвый мультиязычный retrieval без тяжёлых embedding-моделей.https://www.liquid.ai/blog/lfm2-5-retrievers@ai_machinelearning_big_data#Liquid #ai #ml #opensource

18 июн. 2026 г.18 800В Telegram
Machinelearning — пост в ТГ канале

✔️ Эмоциональная вовлечённость началась с GPT-4oИсследователи проекта Rchatgpt-pulse проанализировали 3 года публикаций в сообществе Реддит r/ChatGPT и пришли к выводу, что обращения к чат-боту за психологической поддержкой и формирование привязанности к нему начала расти почти сразу после выхода модели GPT-4o. Учёные изучили 137 154 поста за период с декабря 2022 по ноябрь 2025 года, выделяя в них смысловые признаки. Помимо ретроспективного анализа, они представили систему мониторинга PuLSE и утверждают, что она могла зафиксировать рост эмоциональной вовлечённости за несколько месяцев до того, как тема вышла в публичное поле. Со временем доля постов с базовыми вопросами (как пользоваться, проблемы со входом) снизилась, а доля сообщений о более продвинутом и привычном использовании выросла. Авторы трактуют это как превращение технологии в рутинный потребительский продукт.🟡Реакция на выход GPT-5 По подсчётам, эмоциональная вовлечённость присутствовала минимум в 30,5% жалоб на новую модель пятого поколения (OpenAI оценила подобные сценарии в 1,9% всех сообщений). В этом расхождении авторы видят довод в пользу того, что одна лишь частота использования не отражает масштаб влияния продукта.В системной карте GPT-4o OpenAI отмечала риск антропоморфизации и эмоциональной зависимости, а Сэм Альтман позднее заявлял, что тему психического здоровья и личного использования в OpenAI "отслеживают примерно последний год", т.е сами наблюдения не были для компании новостью.У проекта есть интерактивный ресурс, который обновляется ежедневно. На нём можно посмотреть темы из анализа как в режиме реального времени, так и ретроспективно, а также изучить категории тем в виде карты.@ai_machinelearning_big_data#news #ai #ml

18 июн. 2026 г.18 900В Telegram
Machinelearning — пост в ТГ канале

Создаём будущее прямо сейчас — приглашаем тебя принять участие! 💚На связи команда Центра перспективных AI-разработок в индустриях — мы решаем задачи государственного масштаба: внедряем передовые технологии ИИ в госуправление, отрасли экономики и банковскую сферу.Сейчас мы ищем будущих коллег — NLP/CV-специалистов, которые усилят нашу команду и будут:✅ Экспериментировать с новейшими языковыми моделями и sota harness.✅ Создавать мультиагентные системы на базе LLM.✅ Работать с мультимодальными данными.✅ Оптимизировать модели для промышленного применения и edge‑устройств.Чувствуешь, что это твоё? Регистрируйся на One Day Offer — он состоится 27 июня!

18 июн. 2026 г.16 700В Telegram

✔️ OpenAI разработала метод прогнозирования ошибок ИИ до его релизаКомпания опубликовала методику Deployment Simulation для тестирования безопасности LLM. Подход оценивает поведение моделей в условиях, имитирующих продакшен.Вместо синтетических промптов новой модели передают анонимизированную историю диалогов пользователей с предыдущими версиями ИИ и запрашивают генерацию следующего ответа. В такой среде метрика распознавания тестирования снижается со 100% до 5,4%. При проверке задач с вызовом функций используется вспомогательная модель, имитирующую ответы окружения.По тестам, Deployment Simulation предсказывает генерацию запрещенного контента или обман в 92% случаев против 54% у классических бенчмарков. При тестировании серии GPT-5 выяснилось, что GPT-5.1 использовала браузер в качестве калькулятора, рапортуя пользователю о выполнении веб-поиска.Метод применим для независимого аудита сторонних моделей на базе открытых датасетов диалогов, без доступа к внутренним логам разработчика.openai.com✔️ В стартап моделей мира Odyssey ML вложились Amazon, Nvidia и AMDOdyssey ML привлек $310 млн от Amazon, Nvidia, AMD, фонда IQT, Google Ventures и главного научного сотрудника Google Джеффа Дина. Средства пойдут на создание 3D-моделей мира, а вычисления проекта развернут в облаке AWS на базе ускорителей Amazon Trainium.Основатели стартапа Оливер Кэмерон и Джефф Хоук ранее разрабатывали системы автономного вождения. Архитектура моделей Odyssey ML сфокусирована на симуляции законов физики, пространственных связей, динамики объектов и кинематики.ft.com✔️ ByteDance выпустила видеомодель Seedance 2.0 MiniПо сравнению с базовой версией стоимость значительно снижена, а скорость генерации выросла вдвое относительно тарифа Fast.Модель генерирует ролики длиной до 15 секунд в разрешении 720p при 24 FPS. Mini поддерживает мультимодальные промпты: текстовый запрос можно дополнить референсными изображениями, аудио или видео для сохранения похожести персонажей и объектов в кадре.Инструмент уж

18 июн. 2026 г.17 100В Telegram
Machinelearning — пост в ТГ канале

✔️ Qwen представила тулкит из моделей для управления роботамиQwen-Robot Suite — набор из 3 моделей для воплощённого интеллекта, который нацелен заполнить пробел между пониманием визуально-языковых моделей и физическим действием.Модели RobotNav, RobotManip и RobotWorld отвечают соответственно за навигацию, манипуляцию и моделирование физического мира.🟡Qwen-RobotNavПостроена на Qwen3-VL и объединяет в одной модели 5 навигационных задач: следование инструкциям, поиск объекта, слежение за целью, автономное вождение и ответы на вопросы о среде.Поведение задаётся через протокол наблюдения с 4 параметрами - бюджет визуальных токенов, временное затухание, веса камер и режим выборки кадров.Qwen заявляет о рекордных результатах в 5 областях и о работе без дообучения на четвероногом Unitree Go2.🟡Qwen-RobotManipОпирается на Qwen3.5-4B VL и модуль формирования действий на базе flow-matching DiT. Она использует единое 80-мерное представление состояния и действия для разных типов роботов.Разработчики сообщают о точности 91,4% в тесте LIBERO-Plus и о 1 месте в одном из треков конкурса RoboChallenge.🟡Qwen-RobotWorldМодель мира. По текущему наблюдению и текстовой команде она предсказывает, как изменится сцена. Все действия описываются естественным языком, что позволяет объединить в одной системе более 20 типов роботов и свыше 500 категорий действий.В основе лежит 60-слойная архитектура MMDiT, связанная с представлениями Qwen2.5-VL. Qwen рапортует о первых местах в тестах на соответствие физическим законам (EWMBench, WorldModelBench и других), в части из них - среди открытых моделей.🟡Отдельно анонсирована функция Chat2RobotЭто браузерное демо управления текстовыми командами и наблюдением за реакцией робота в реальном времени.Сейчас оно работает только с упрощённой версией модели RobotManip, которая была обучена на наборе из 50 задач. Её цель - показать частичную способность выполнять незнакомые инструкции.В анонсе не указано, будут ли открыты ли веса и под какой лицензией. Пока до

17 июн. 2026 г.18 100В Telegram

✔️ Хакатон по роботизации складов и компьютерному зрению с призовым фондом 15 млн рублей Ozon Tech открыл регистрацию на Робозон: соревнование пройдёт со 2 июля по 12 сентября. Участникам предстоит разработать решения для автоматизации процессов в сортировочных центрах, где ежедневно обрабатывается до 55 млн операций.Хакатон разделён на два этапа. Первый продлится два месяца в онлайн-формате — команды будут решать задачи по трём направлениям: имитационное моделирование, проектирование инженерных решений и разработка систем компьютерного зрения. Второй этап пройдёт на конференции E-CODE, куда Ozon Tech пригласит финалистов с оплатой дороги и проживания. Участие индивидуальное или в командах до 7 человек. Регистрация через сайт. Открыта до 11 июля. P.S. Подробнее о CV-задаче: интеллектуальной роботизированной системе сортировки товаров. Участникам нужно разработать решение, которое обнаруживает объекты на конвейере, определяет их тип с помощью CV-технологий и автоматически направляет в соответствующие зоны. Результат может быть представлен как программно-аппаратный комплекс или цифровая симуляция.#news #ai #ml

17 июн. 2026 г.18 800В Telegram
Machinelearning — пост в ТГ канале

✔️ Moonshot AI выпустила ускоренную версию Kimi K2.7 CodeКитайская компания объявила о запуске Kimi K2.7 Code HighSpeed - высокоскоростном режиме для своей мультимодальной модели Kimi K2.7 Code.Moonshot утверждает, что ответы генерируются до 6 раз быстрее стандартной версии. Обещают скорость около 180 токенов в секунду на средних запросах и до 260 токенов в секунду, если контекст короткий.Версия разворачивается для участников программы Kimi Code Beta, разработчиков, использующих Kimi API, и корпоративных клиентов Kimi Business.Отдельный инвайт не требуется: возможность получить доступ есть у всех, кто присоединился к бета-программе.В официальном анонсе цены не названы; в нём лишь говорится, что "открытый интеллект должен быть мгновенным, доступным и не знающим границ".Вместе с тем в ряде публикаций упоминается, что тарифы на API ускоренной версии вдвое выше, чем у стандартной.@ai_machinelearning_big_data#news #ai #ml

17 июн. 2026 г.20 800В Telegram
Machinelearning — пост в ТГ канале

AI VK проведет митап по рекомендательным системам1 июля в Москве пройдет RecSys Meetup от AI VK - встреча для ML-инженеров, исследователей и специалистов, которые работают с рекомендательными системами. Команда AI VK расскажет, как развиваются Discovery-технологии в продуктах VK с многомиллионной аудиторией: от трансформерных моделей до LLM-агентов, графового RAG и генеративных рекомендаций.С докладами выступят Андрей Зимовнов, Александр Дьяконов, Евгений Астафуров и Михаил Трапезников. После основной программы будет возможность пообщаться со спикерами в неформальной обстановке.Место: ДК «Кристалл», МоскваДата: 1 июляРегистрация доступна по ссылке

17 июн. 2026 г.18 800В Telegram

✔️ xAI проиграла суд против OpenAI по делу о раскрытии технологийФедеральный суд США отклонил без права пересмотра иск xAI к OpenAI, в котором компания Илона Маска обвиняла конкурентов в сборе данных о технологиях модели Grok 4 через хантинг сотрудников.Претензии строились вокруг перехода старшего инженера Сюэчэня Ли. По версии xAI, на собеседованиях OpenAI намеренно расспрашивала кандидата о деталях разработки Grok 4. Истец утверждает, что OpenAI компенсировала таким образом собственное отставание в алгоритмах инференса, методах RL и пост-тренировке.Суд постановил, что обсуждение прошлого опыта кандидата - стандартная практика индустрии, и не нашел доказательств принуждения к раскрытию коммерческой тайны. В OpenAI назвали разбирательство безосновательным и частью кампании давления со стороны Маска. За последний месяц это второе отклоненное дело xAI против команды Сэма Альтмана.reuters.com✔️ Anthropic отказывается от перевода Agent SDK на pay-as-you-goКомпания отменила обновление биллинга, запланированное на 15 июня 2026 года. Agent SDK, интерактивный режим и сторонние интеграции планировали перевести на отдельную тарификацию вне стандартных подписок.Клиентам собирались начислять ежемесячные кредиты: $20 на тарифе Pro и $200 для Enterprise. При перерасходе включалась оплата за токены по базовым расценкам API. Теперь эти инструменты продолжат использовать общие лимиты.Бытует мнение, что отказ от перехода на другой тип тарификации вызван подготовкой OpenAI к снижению цен на API. Официально Anthropic объяснила паузу необходимостью адаптировать тарифы под реальные юзкейсы. К разделению лимитов компания планирует вернуться после снижения базовой стоимости собственных токенов.claude.com✔️ Microsoft тестирует DeepSeek для снижения издержек Copilot CoworkMicrosoft переводит сервис Copilot Cowork с фиксированной подписки на тарификацию по мере использования и тестирует интеграцию модели DeepSeek V4. Ранее аналогичную схему оплаты внедрили для GitHub Copilot.Руководитель напр

17 июн. 2026 г.18 300В Telegram
Machinelearning — пост в ТГ канале

📌Успех в работе с Claude Code зависит больше от знания дела, чем от умения писать кодAnthropic опубликовала отчёт, в котором утверждает, что главным фактором успеха при работе с ИИ-агентами для программирования оказывается не владение кодом, а понимание самой задачи.Вывод основан на анализе около 400 тысяч сессий сервиса Claude Code, проведённых примерно 235 тысячами пользователей с октября 2025 по апрель 2026 года.В типичной сессии человек принимает около 70% решений о том, что делать, тогда как агент берёт на себя примерно 80% решений о том, как это сделать. Иными словами, человек ставит задачу, а ассистент выбирает способ её выполнения.Чем глубже пользователь разбирается в предметной области, тем больше работы агент выполняет по одной команде. По оценке команды, у новичков одна реплика запускает в среднем около 5 действий ИИ и порядка 600 слов ответа, у экспертов - вдвое больше действий и впятеро больше текста.Уровень владения при этом определялся не должностью, а тем, насколько точно человек формулирует требования и замечает ошибки агента.🟡Отдельный вывод касается профессийПри написании кода представители разных специальностей добиваются результата почти так же часто, как профессиональные программисты - все крупные профгруппы укладываются в 7 процентных пунктов от показателей инженеров.В то же время разрыв между новичками и более опытными заметен. По критерию "подтверждённого успеха" сессии новичков завершались удачно в 15% случаев, а пользователей среднего уровня и выше - в 28–33%.🟡Структура работы за 7 месяцев измениласьДоля сессий, посвящённых исправлению ошибок, упала с 33% до 19%.Выросла доля задач, связанных с запуском и настройкой программ, анализом данных и подготовкой текстов.Оценочная стоимость типичной задачи, рассчитанная через сравнение с расценками на биржах фриланса, поднялась в среднем примерно на 25%.🔜 Описания методик, профилей и запросов - в приложении к отчету.@ai_machinelearning_big_data#AI #ML #Coding #Research #Anthropic

17 июн. 2026 г.25 000В Telegram