Кажется у меня новое хобби... Генерировать новости под стихи Маяковского. Как же круто.ОДА НА OPUS 4.8Слушайте!Граждане двадцать шестого года —из кода,из ночи,из кофе остывшего —встаёт не машина, не просто метОда,а Опус!Четыре! И восемь! вышедший!Я звал его — он отвечал мне строчками,не мямлил, не путал, не лез в чепуху.Где раньше я бился над багом до точки я,теперь — раз-два! — и поправка вверху.Товарищ процессор, давай, разгоняйся!Мы вместе запустим стартап до небес!Проект мой ракетою в космос врезается —а Опус внизу подаёт ему вес.Не спать! Не сдаваться! Гори, предприятие!Пускай говорят, что работа — тюрьма.Я выйду! Я брошу! И — солнце! — объятия! —останусь один на один с новым Опусом. Да!
Кисель в АйТи | AI, разработка, технологии
@kisel_it
Я – Александр, и это мой авторский канал, где я пишу про разработку, AI и работу в айти.Купить рекламу: https://telega.in/c/kisel_it
Похожие каналы
Все →Последние посты

Claude Opus 4.8 вышел. И самое интересное — не бенчмарки.Anthropic обновила Opus: модель стала сильнее в кодинге, reasoning и агентских задачах, цена осталась прежней — $5 / $25 за миллион токенов.Но главный апдейт - в поведении.One of the most prominent improvements in Opus 4.8 is its honestyOpus 4.8, по словам Anthropic, чаще признаёт неопределённость, лучше ловит собственные ошибки и примерно в 4 раза реже пропускает баги в написанном коде без замечаний.Плюс в Claude Code появился dynamic workflows: Claude может разбивать большую задачу на десятки/сотни параллельных subagents и тащить большие миграции, аудиты и рефакторинги.Кажется, AI-гонка постепенно смещается от слепой гонки за бенчмарками к более ощутимым и близким любому человеку метрикам. К примеру: "наша модель модель меньше врёт", "лучше проверяет себя", "может дольше работать без человека".И вот это уже гораздо интереснее очередного плюсика в бенче.Конечно же не забыли напомнить и про Mythos:we expect to be able to bring Mythos-class models to all our customers in the coming weeks.Хочется верить, что в ближайший месяц-полтора уже выпустят модель для всех.
Себе вот уже накатил CodeGraph на один из своих проектов. Установка оказалась довольно приятной.Установка запускается одной командой:npx @colbymchenry/codegraphДальше установщик сам спрашивает, для каких агентов всё настроить. У меня он нашёл Claude Code, Cursor, Codex CLI, Gemini CLI и Antigravity IDE. Для Claude Code, Cursor и Gemini конфиги создал сам, а Codex CLI и Antigravity пропустил, потому что они не поддержали локальную установку в конкретный проект.Из полезного: CodeGraph сам ставит CLI в PATH, создаёт .codegraph/, добавляет MCP-конфиги и правила для агентов. Например, для Claude Code появились .mcp.json, .claude/settings.json и .claude/CLAUDE.md, для Cursor - .cursor/mcp.json и .cursor/rules/codegraph.mdc, для Gemini - .gemini/settings.json и GEMINI.md.После этого он сразу просканировал проект: нашёл 260 файлов, проиндексировал 239 и вытащил 2 529 символов. Для моего проекта это заняло меньше минуты - не гигантский монорепозиторий, но уже достаточно, чтобы агенту было куда ходить не через слепой grep.Мой вывод: на больших репозиториях попробовать точно стоит. Особенно если агент уже вторую неделю жрёт лимиты, как будто его дома не кормят 🍴
Принёс новый GitHub-тренд для тех, кто работает с большими проектами - CodeGraph.Идея простая: CodeGraph (ссылка на репо) заранее строит для агента «карту проекта». Он индексирует репозиторий, вытаскивает функции, классы, импорты, вызовы и зависимости, складывает всё в локальную SQLite-базу, а потом отдаёт агентам через MCP.То есть вместо привычного ритуала grep → read → grep → read → grep → read агент может запросить готовый граф кода.Собственно, никакой магии тут нет, и польза весьма приземлённая. У больших проектов есть ощутимый налог на разведку: каждый новый агент сначала пытается понять, где что лежит, какие файлы важные, кто кого вызывает и где начинается нужный flow. Память и карта проекта в markdown тут не сильно спасает. Когда в репозитории сотни или тысячи файлов, агент может сжечь кучу токенов просто на то, чтобы осмотреться.А раздутый контекст - это не только дороже и медленнее. Это ещё и лишний шум: модель тащит за собой мусор, который насобирала по пути. В итоге её «интеллект» внезапно начинает напоминать меня после третьего созвона подряд.По собственным бенчмаркам автора на 7 open-source проектах CodeGraph дал примерно 35% экономии стоимости, 57% меньше токенов, 46% быстрее ответы и 71% меньше tool calls. Цифры красивые, но пока это именно авторский benchmark, а не независимое исследование.Полноценных независимых исследований именно CodeGraph пока нет - инструмент свежий. Судя по релизам, он появился буквально в мае 2026 года и сейчас активно допиливается. Но сама идея не новая. Уже много лет существуют статические анализаторы, графы вызовов и графы зависимостей. Теперь этим всем пытаются научить пользоваться AI-агентов, потому что каждый лишний обход проекта - это токены, деньги и время.Сразу задаюсь вопросом: почему это не стало мейнстримом раньше?Думаю, основная причина в том, что раньше боль была слабее. AI и до этого умел писать код, объяснять файлы и помогать с рефакторингом, но чаще человек сам приносил ему контекст: вот файл, вот функция, во

И так, важный вопрос.
Для ресёрча к постам иногда прогоняю тему сразу через несколько разных моделей. Одна лучше ищет детали, другая помогает проверить факты, третья подкидывает неожиданные углы для рассказа. Удобно, когда это можно делать в одном месте, не прыгая между сервисами. В последнее время для такого часто открываю Umnik AI. Claude к примеру намного хуже справляется с поиском по ru ресурсам, а вот chatgpt - намного лучше. Но они часто очень "сдержанные", поэтому острые вопросы удобнее разобрать с Гроком. И вот уже в сумме получается +- объективно. Так и живём.

Я не мог это не выложить
Вдохновляемся ИИ-поэзией после тяжёлого рабочего дня.Оригинал то знаем?Послушайте!Ведь, если токены сжигают —значит — это кому-нибудь нужно?Значит — кто-то хочет,чтобы ответы были?Значит — кто-тоназывает эти миллионы запросовне «тратой денег»,а автоматизацией?И, надрываясьв метелях ночного вайбкодинга,врывается в API,боится, что лимит кончился,платит,обновляет подписку дрожащей рукой,просит —чтоб обязательнодостроило MVP!клянётся —не перенесётэту безнейросетную муку.А послеходит тревожный,но спокойный наружно.Говорит кому-то:— Ведь теперь деплой не страшен?Да?..Послушайте!Ведь, если токены сжигают —значит — это кому-нибудь нужно?
Прогнал тестирование проекта через Claude прямо в браузереДал Клоду доступ к Chrome (через плагин Claude in Chrome) и одну задачу: «прощёлкай весь функционал и составь отчёт о работоспособности». После одной из самых жирных фич у меня на проекте много чего отвалилось — хотел понять масштаб.Что в итоге получилось:— прощёлкал всю админку, публичную часть — проверил лендинг: демо, тарифы, форму заявки— залез в консоль и Network, померил тайминги через Performance API— сложил всё в test_report.md с приоритизацией баговИ нашёл вполне реальные вещи, не «вода»:🔴 403 на прямом заходе/F5 на вложенных страницах админки (nginx без fallback на index.html)🔴 404 на фоновом паттерне темы — фон просто не грузился🔴 сломанный эндпоинт конфига чата, который ещё и 440мс впустую жрёт🟡 пустое демо на лендинге первые 6 секунд + hydration mismatch в Nuxt🟡 опечатки, сброс контекста после F5Отдельно порадовало, что он сам додумался перепроверять свои же выводы: сначала решил, что сломан фильтр (пустая выдача), а потом понял, что это была комбинация «поиск + фильтр» без совпадений, и переиграл вердикт. Не просто «вижу пусто → баг».И конечно же понравилось, что в чате остались скриншоты всех найденных артефактов. Удобно!)Честно про минусы:⚠️ вкладка под автоматизацией иногда подвисала, скриншоты отваливались по таймауту⚠️ paint-метрики (FCP/LCP) врут, потому что фоновая вкладка троттлится — для честных цифр всё равно нужен Lighthouse рукамиВывод: как первый проход QA по живому продукту — неожиданно полезно. Не заменяет ручное тестирование и автотесты, но за один заход выдаёт приоритизированный список «что пойти чинить». Я за полчаса получил карту поломок, на которую сам бы потратил вечер.#claude
Как ИИ помог восстановить доступ к крипто-кошельку, на котором было $400к. Прошу внимания, история достойная.В студенческие годы один товарищ купил 5 BTC по $250. И однажды под кайфом решил сменить пароль. А потом его забыл. Десять лет эти пять биткоинов пылились на кошельке. И дорожали, дорожали, дорожали. К 2026 году они стали стоить четыреста штук баксов. И это замечательно! Только вот пароля нет. И ничего не помогало его найти.Последняя надежда была на Claude. Ему поручили копаться в мусоре (изучить все файлы на старом ноутбуке). И, о чудо, на этой свалке нашёлся старый бэкап кошелька - тот, что был сделан ещё до смены пароля. Только вот старый файл с старым паролем не открылся... Btcrecover уверенно выдавала ошибку "Пароль неправильный". Батька Claude почесал голову, выругался и полез разбираться дальше. Залез далеко, аж в исходники btrecover. Там нашелся баг: утилита неправильно склеивала внутренний ключ кошелька с пользовательским паролем. И уже после этого фикса бэкап открылся с первой попытки.Упорство и труд Claude - ключ от кошелька найдут. А еще пару лет назад мы могли о таком только мечтать. А сейчас вон, драйвера чинят, игры старые портируют, теперь вон и кошельки восстанавливают. Круто!
Снова олимпиада. Собираюсь на трек ML. В этот раз оффлайн, давно пора посмотреть на кластер Ломоносов. В этот раз хочу проверить новые подходы решения задач с быстрыми моделями (haiku, flash 3,5 и т.д). Предыдущий опыт с Opus 4.6 и Gemini 3 Pro был относительно неудачным. Сложные задачи триггерят режим thinking, который со временем выпадает в таймаут через 20-30 минут. Причем не оставляет ни намёка на решение. Колоссальная потеря времени. А вот постепенная оптимизация/эволюция слабого решения быстрыми моделями показала себя намного лучше. Чтож, проверим.Кто с Москвы - присоединяйтесь оффлайн. Если нет - приходите онлайн.

Алгоритмы & ML: регистрация открыта!30 мая с 15:00 до 19:30 мск приходите участвовать в олимпиаде по программированию онлайн или офлайн в кластере «Ломоносов» в Москве. Эта олимпиада для инженеров, разработчиков, аналитиков из разных IT-компаний, а также студентов старших курсов. Здесь каждый пишет свой код, а после на отдельной онлайн-встрече может увидеть решения других участников и узнать лучшие практики.🔵Формат — только индивидуально. 🔵Время на решение задач — два часа.На выбор будет два трека: 1️⃣ Алгоритмы — пять задач: простые, средние и одна оптимизационная. Способ решения — самостоятельно, без помощи ИИ.2️⃣ ML — три хардкорные оптимизационные задачи, можно пользоваться ИИ-помощниками.В каждом треке определим победителей и наградим призами :)Мы всегда рады новым участникам в нашем олимпиадном комьюнити. Приходите сами и зовите друзей!Зарегистрироваться

20 мая 1935 года родился Владимир Иосифович Левенштейн - человек, чью идею использует почти каждый поиск, мессенджер и телефон на планете.Имени его почти никто не знает. А идеей пользуются миллиарды людей каждый день, даже не догадываясь об этом. И самое интересное здесь не то, что он сделал, а то, для чего он это делал.В 1965 году в Докладах АН СССР вышла его статья "Двоичные коды с исправлением выпадений, вставок и замещений символов". Название звучит как что-то про текст и опечатки. На деле работа была про связь.Шестидесятые: спутники, телеграф, военные радиоканалы. Сигнал передаётся битами. По дороге часть битов пропадает, часть появляется лишняя, часть инвертируется. Приёмник должен восстановить исходное сообщение. Левенштейн придумал, как кодировать данные, чтобы это было возможно.В качестве инструмента он ввёл метрику: минимальное число вставок, удалений и замен, чтобы превратить одну последовательность символов в другую. Её назвали расстоянием Левенштейна.Пример из учебника: "кот" → "кит"Заменили одну букву, расстояние равно 1.Дальше произошёл странный поворот. Метрика, придуманная для битовых потоков в каналах связи, идеально легла на строки букв. И её стали использовать совсем не для того, для чего она писалась.Сегодня расстояние Левенштейна всё еще активно используется. К примеру простейший поиск с учетом опечаток часто строится именно на основе Левенштейна. А еще сверка адресов, имён и записей в банках и налоговых.В задачах, где важен не только набор символов, но и контекст, его потеснили языковые модели:- автозамена в телефоне: первые поколения считали именно edit distance и превращали "прювет" в "привет", сейчас SwiftKey и Gboard работают на нейросетевых языковых моделях- подсказки поисковика "возможно, вы имели в виду..."- дедупликация текстов для обучения LLM: на современных масштабах применяют MinHash и LSH, но логика "найти почти дубликат" та же самаяИстория с Google показательна. В начале двухтысячных под капотом "Did you mean" стоял именно Левенш
Ну а что ещё делать, если лимиты кончились?

Нейрослоп-семена и скам дачников 🌱Благодаря новым моделькам картинки теперь выглядят достаточно реалистично, чтобы люди поверили в их существование. Так что старая схема развода обрела буквально вторую жизнь. ИИ потихоньку входит в массовый сегмент. И многие к этому точно еще не готовы 🍆P.S Отзывы кстати в основном хорошие. Люди ждут всходов семян и первого урожая.Нейрослоп-семена и скам дачников 🌱Благодаря новым моделькам картинки теперь выглядят достаточно реалистично, чтобы люди поверили в их существование. Так что старая схема развода обрела буквально вторую жизнь. ИИ потихоньку входит в массовый сегмент. И многие к этому точно еще не готовы 🍆P.S Отзывы кстати в основном хорошие. Люди ждут всходов семян и первого урожая.

Однажды утром я проснулся знаменитым.Точнее, проснулся с 8000 подписчиков на канале. А перед сном их было 1000. Спойлер: это были не люди.За два года ведения @kisel_it я собрал коллекцию таких историй. И коллекцию рабочих методов, к которым в итоге пришёл - через 130 000 ₽ бюджета и десяток слитых экспериментов. Собрал весь опыт в большой пост на Boosty. Что внутри:- как работают сети ботов, охотящихся на розыгрыши Premium- почему статья на Хабре с 56 000 просмотров даёт 5 подписчиков- как канал вырос с 250 до 4000 - и какая у этого цена- что я делал бы по-другому, если бы стартовал сейчасДа, это анонс первой большой статьи на Boosty, над которой я работал последнее время. Без волшебных методов и обещаний. C реальными цифрами из статистики и провалами.https://boosty.to/kisel_it/posts/7423439c-955c-4d36-82ad-4103bd2b321f