чем больше я изучаю то, как работают всякие готовые агенты из коробки (клод, хермес и иже с ними), тем больше я вижу, сколько токенов может тратиться на какую-то хуйню, которую можно было бы вообще не делать или часть фигни, которую можно было бы сделать руками в 10 раз быстрее и точнеепоручая лишь часть генерации / операций агентам конечно, со стороны то, что они вообще кучу всего могут сделать самостоятельно, выглядит как магия, но за этим всем стоит просто хорошо проработанный детерминированный граф под популярные задачи, на который наложен ризонинг если задач много разных, и они не особо повторяющиеся (например, вы для работы постоянно че-то формируете, и не за что зацепиться в плане оптимизаций), это оч хороший способ быстро автоматизировать свою рутину но если это конкретные задачи, которые имеют повторяемость во времени и некий скоуп около-стандартных пререквизитов, то гораздо эффективнее все еще делать своих агентов с нуляда, это требует code-first подхода, но это оптимально ничего не будет жечь лишние токены, и не будет бегать полу-контролируемых, фиг знает что выполняющих на бекграунде навороченных агентов будет четкая понятная система, сформированная под понятные, нужные вам процессыв бизнесе мл/эйяй приносит пользы там, где есть четкий сформулированный повторяющийся процесс и жесткий скоуп, который надо автоматизировать (и часть того, что все равно пойдет на руки) я про это уже кучу раз везде рассказывалаэто не изменитсяс агентами - та же самая херня раньше были модельки, которые могли делать 1 решение, и из них строился некоторый зоопарк для автоматизации процессатеперь будут агенты, которые могут делать N решений, каждый может оркестрировать какое-то количество моделек и отвечать за свой бизнес / продуктовый / личный процесс, из них также можно сделать зоопарк, работающий вместено все это не какой-то качественный переход, что вместо человека можно нанять агента, и он все сам зарешает и сделает, а просто чуть более усложненная логикаправила автоматизац
mnctty at IT | AI в ритейле, стартап в медтехе | курсы, лекции и выступения | разработка агентов на заказ
@mnctty_at_it
Yet another ML/DL channel по всем вопросам: @mncttyличный канал: @explored_by_mncttyиг: @mncttyютуб: @mnctty
Похожие каналы
Все →Последние посты

А куда уходят ваши токены? 😂Колитесь в комментариях, сколько вы уже потратили на "эйяй", и какие штуки заставили реально работать
Прощай vibe coding, да здравствует agent engineering😜Андрей Карпати провел очередной разговор, на этот раз с партнёром Стефани Чжан. Что символично, год спустя после того, как он придумал термин "vibe coding".Основные тезисы.1. Эра Software 3.0, теперь LLM это вычислительная среда, где естественный язык как код, а агенты как runtime. LLM - это новая операционная система. Сразу вспоминаю MemoryOS. 2. Почему Карпати и ты чувствуете себя ламером даже после 20+ лет в коде. Карпаты раньше читал любой репозиторий и понимал, что происходит. Сейчас LLM генерирует код, который он не писал и не полностью контролирует. Теперь, человек управляет не логикой, а намерением через естественный язык. Парадокс - чем лучше модели, тем меньше традиционное программирование гарантирует понимание системы.3. Таким образом, теперь классическое обучение кодеров должно измениться, нужно не только учить человека писать код самому, но и работать с агентами. Глубина понимания + инструмент МАС.4. Vibe Coding vs Agentic Engineering. Vibe coding - хаотичные промпты, выглядит ок, но нет архитектуры. Agentic engineering - процесс работы с памятью и инструментами, формальные проверки, многоагентные системы, оркестрация, безопасность и мониторинг. В целом появляется сопутствующее понятие AgentOps.5. Вопросы доверия, безопасности и контроля. Агенты уже нуждаются в жёстких рамках, к примеру, меню доступных действий, а не свободный диалог. Проблема верифицируемости встаёт на важное место. В классике, если код компилируется и проходит тесты - скорее всего правильно. В Software 3.0 LLM прошла тесты, но логика непрозрачная, дырки в безопасности и тп. Крч без работы не останемся. 👍Итого в 2026 и далее:1. Агенты повсюду, но не как умные ассистенты, а как спец юниты. 2. Инструменты для агентов станут важнее самих промптов. 3. Верификация через симуляцию/среду - запуск агента в песочнице станет стандартном. 4. Человеческое суждение станет ключевым навыком, заменяя знания синтаксиса ЯП.
Презентация, которой я на 100% довольнаБыл запрос на выступление, в которым я делаю технический онбординг для AI продактов Чуть позже залью запись Достаточно большая часть выступления посвящена метрикам AI систем, которые могут понадобится для их оценки с разных сторонКогда я готовила материал, мне показалось, что обучающий интенсив - как эти метрики применять на конкретные продукты и измерять ими эффективность конкретных внедрений AI-я - может быть полезенНапишите, если хотели бы прийти на такой интенсив
каждый раз, когда начинаю читать курс LLM для менеджеров в Сбере, обязательно находятся несколько штуков, которые в обсуждении к лекции (любой) начинают развозить тред на эту тему какие классные у них решения, как они "даже лучше" антропик, опенэйяй, [вставь свой любимый аналог], как у них есть интеллект и "мышление, похожее на человеческое" и все такое, (А У ДРУГИХ - НЕТ!) 🤭теперь понятно, откуда у них вообще это в голове хаха ну что ж ЛАДНО в комментах к посту LDT там еще скрины замечательные есть

gigachat gigachat gigachat gigachat, наш сотрудник проник в офис сбера и сфоткал там ЭТО
Почему GenAI в кодинге работает круто, а в энтерпрайзе побед меньшеМне кажется любой, кто занимается внедрением GenAI в энтерпрайз сталкивается с тейком «вон клод уже сам написал компилятор С, а у нас до сих пор тысячи людей в операциях сидят. Давайте развернем, значит, OpenClaw и…». И на самом интересно, а почему в кодинге победы, а в энтерпрайзе нет? Питер Тиль говорил, что именно за такими противоречиями и скрываются миллиардные компании. У меня хоть масштаб и не такой, но вопрос стоит не менее остро.Для начала: а что мы вообще хотим от агентов? Принимать хорошие решения. И на низком уровне: какую mcp ручку дернуть и кнопку нажать на каждом конкретном шаге. И на высоком: как помочь клиенту, который не может сделать перевод в таджиктстан. Чтобы принимать хорошие решения мы опираемся на факты, комбинируя которые здравым смыслом, предсказываем, что произойдет с миром и нами от нашего выбора.Факты бывают разные. Верхнеуровневые: «мы не умеем переводить деньги в таджикистан», «если послать человека в жопу, он обидится». Низкоуровневые: «кнопка «платежи» на главной, открывает экран со всеми платежами, включая трансграничные», «если написать console.log(“hello”) в коде, то в логе появится запись hello». Общие для всех: «import “x.h”» добавит в модуль сигнатуры внешних объектов». Специфичные для организации: «лучше всех на второй линии проблемы с комплаенсом решает Иван Андреевич». Неизменные во времени: «Т-Банк основал Олег Тиньков». И изменяющиеся: «Сбером управляем Герман Греф».К чему я. Чтобы LLM смогла качественно решить проблему ей нужны ВСЕ верхнеуроаневые и низкоуровневые факты, необходимые для правильного решения. Эти факты могут лежать либо в весах, либо в контексте. Других вариантов нет.И именно в SDLC покрытие фактов в силу природы задачи самое хорошее: вся информация о языках программирования и инструментарии живет в весах LLM. Вся специфика задачи закодирована самой кодовой базой + инструкциями со стороны инженера, управляющего агентом. Остается сделать пра

Вышел свежий 2026 AI Index Reporthttps://hai.stanford.edu/ai-index/2026-ai-index-report
Alibaba с Qwen седлает harness и монетизацию. 🪨🪨🪨Alibaba переводит свои ИИ-проекты на коммерческие рельсы. Речь идет о глубокой стратегической трансформации, а не о сворачивании разработок. Корпорация действительно меняет приоритеты с погони за технологическим лидерством на прагматичную задачу извлечения прибыли. Происходит смена приоритетов от гонки технологий к монетизацииКлючевые решения, принятые Alibaba в этом году, подтверждают этот разворот:1. Коммерциализация как главная цель. 🚬 В конце марта 2026 года генеральный директор Alibaba Эдди У поставил амбициозную цель - увеличить выручку облачного бизнеса и сферы ИИ до $100 млрд в год в течение пяти лет. 2. Выпуск проприетарных моделей. 😎 Компания уже начала выпускать модели с закрытым исходным кодом, такие как Qwen3.6-Plus (обновите Qwen chat она уже там), чтобы получать прямую прибыль от их использования через свою облачную инфраструктуру. Доступ к новым мощным моделям, вроде Qwen3-Max, теперь предоставляется на платной основе.4. Очень интересное. Создание нового подразделения "Token Hub". 🌿 Для ускорения этого процесса в марте было создано специальное подразделение во главе с самим Эдди У. Суть стратегии - превратить вычислительные токены, генерируемые при работе с ИИ, в основной товар, за который будут платить корпоративные клиенты. Токеномика техногигантов против клиентской компактизации, имхо, будет интересно. 👍5. Кадровые перестановки, как отражение новой стратегии. 🇨🇩 Ключевые перестановки в команде:- Уход "идеологов" открытого кода: Главный архитектор Qwen Линь Цзюньянь, публично попрощавшийся с проектом фразой "me stepping down. bye my beloved qwen", покинул компанию в начале марта. Сообщается, что уход Лина и нескольких других ключевых исследователей был напрямую связан с планами руководства "разобрать и переформатировать" команду Qwen, чтобы сместить фокус с исследований на бизнес-задачи.- Назначение "бизнес-ориентированного" 📈 руководителя. Новым главой ИИ-направления назначен Чжоу Цзинжэнь
мне нравится эта журналистка не только потому что у нас одинаковые имена и черты лица похожие 🌚последние пару дней ютуб подкидывает мне видео с ней, и я вам скажу, что в целом, она говорит про ту трушную сторону медали AI пузыря, о которой сейчас особо никто не говорит, тк у всех превалирует другая сторона - с вау-эффектами и единорогамиправда всегда посередине, но не в усреднении, а в том, что с одной стороны да - у нас сейчас у всех разгон всяких тем про AI и то, как он будет менять мир, принося пользу и тд с другой - то, что по сути, маленькие специализированные модели - все еще то, что делает настоящий профита экономика за большими и мощными до сих пор не сходится ни в плане плоской экономики, ни тем более в плане энтропии, количества тепла для инфера и производствапри этом локально (в данный период времени) пока что никто не мешает создавать себе целый офис агентов и радоваться тому, что они имитируют бурную деятельность и даже иногда выполняют какую-то работу за нас короче, все всегда не однозначно, и с AI в том числе, мне нравится всегда видеть процессы с разных сторон, нет черного и белого, нет ничего плоского и прямого, и то, что она там раскрывает про AI - не плохо, а интересно и умно (со стороны тех, кто это разгоняет) надеюсь, вам тоже интересно будет посмотреть 🤔https://www.youtube.com/watch?v=Cn8HBj8QAbk