Машинное обучение / ИИ Бибилиотека

@machinelearning_library

Книги по машинному обучению

125подписчиков

Редко🇷🇺

Последние посты

Машинное обучение / ИИ Бибилиотека — пост в ТГ канале

👣 Я заставил LLM писать Rust полгода. Вот что они стабильно ломаютПолгода я использовал Claude, GPT и Cursor как основной инструмент для написания Rust-кода в проде. Не как «помощник для бойлерплейта», а как полноценного второго разработчика на монолите примерно в 80 тысяч строк (бэкенд обработки потоковых данных, tokio, sqlx, немного unsafe в hot path). Доля сгенерированного кода в коммитах последних шести месяцев около 40%, остальное это правки, рефакторинг и места, куда модель я не пускаю.За это время накопилась коллекция ошибок, которые модели делают с пугающей регулярностью, и которые проходят cargo build, проходят cargo test, иногда даже проходят cargo clippy, и при этом являются либо UB, либо логически некорректным кодом, либо тем самым «работает на моей машине».Я не буду писать, какая модель лучше. К моменту публикации статьи рейтинг устареет. Я расскажу про категории ошибок, которые воспроизводятся у всех топовых моделей весной 2026 года, и которые упираются не в качество обучающих данных, а в фундаментальные слепые пятна архитектуры трансформеров применительно к системе типов Rust.Цифры, которые буду приводить дальше, получены так: я завёл бенчмарк из 50 типовых задач (написать функцию, отрефакторить, добавить фичу), прогонял каждую через четыре модели в течение полугода, и руками классифицировал ошибки. Это не academic-level статистика, но порядки величин показывает.🔜 Читать дальше@rust_code

16 мая 2026 г.39В Telegram

💡 Новое исследование предупреждает о преступном использовании тысяч развертываний открытых моделей ИИ.В ходе 293-дневного наблюдения выяснилось, что 7,5 % системных промптов пропускают вредоносную активность, а хосты сосредоточены в основном в Китае и США.Многие установили Ollama для локального запуска ИИ и оставили его доступным из сети.Сканирование в течение 293 дней выявило 175 108 публичных серверов Ollama в 130 странах.Это означает, что незнакомцы в сети могли отправлять им подсказки и иногда делать больше, чем просто получать текст.Ollama должна слушать только 127.0.0.1, то есть быть доступной только на том же компьютере.Если стоит 0.0.0.0, она слушает всю сеть и может случайно стать публичной.Исследователи зафиксировали 7,23 млн появлений таких хостов, при этом 13 % хостов дают 76 % всех появлений, то есть небольшая группа работает почти постоянно.Около 48 % рекламировали вызов инструментов, что позволяет подсказкам запускать действия, например выполнять функции, а не только генерировать текст.Некоторые публичные установки также используют ретривал, и внедрение подсказок может заставить систему раскрывать данные, которые она подтягивает.Открытые конечные точки могут быть захвачены как бесплатные вычислительные ресурсы для спама или фишинга, и группа из 5 000 хостов в среднем работала 87 % времени.Недавний завирусившийся ИИ-агент OpenClaw (Clawdbot) спровоцировал новый кризис безопасности.С проектом OpenClaw (который сначала был Clawdbot, а потом Moltbot) творится классический хайп-экзит. То, что задумывалось как удобный инструмент для управления компьютером через мессенджеры, на деле превратилось в огромную дыру в безопасности. Идея дать ИИ-агенту привилегированные права изначально выглядела так себе, и теперь мы видим последствия.Из-за того, что Anthropic заставила автора менять название из-за прав на бренд, возникла путаница. Хакеры этим вовсю пользуются: воруют названия и плодят фейковые репозитории с вирусами внутри. Тем временем сотрудники компаний став

31 янв. 2026 г.79В Telegram

✔️ Релиз GLM-4.6V с нативной поддержкой вызова функций.В линейку вошли флагманская GLM-4.6V на 106 млрд. параметров и облегченная GLM-4.6V-Flash (9B). Обе получили контекстное окно в 128k токенов и генерацию смешанного контента, где текст комбинируется с изображениями. Модель может передавать изображения и скриншоты во внешние инструменты без предварительной конвертации в текст, а также встраивать визуальные результаты обратно в цепочку рассуждений.Обе модели уже на HuggingFace, доступны по API и в веб-версии.z.ai✔️ Стартап из шести человек обошел Google Gemini 3 в тесте на логику ARC-AGI.Команда Poetiq заняла 1 место в полузакрытом бенчмарке ARC-AGI-2, набрав 54% правильных решений. Это позволило стартапу уверенно опередить гиганта индустрии: ранее Google отчитывалась о результате в 45% для Gemini 3 Deep Think.ARC-AGI, разработанный исследователем Франсуа Шолле, считается одним из самых трудных испытаний для ИИ. Тест проверяет не просто знания, а способность к абстрактному мышлению и решению принципиально новых задач.Успех Poetiq обеспечен не обучением новой модели, а эффективной оркестрацией уже существующих.poetiq.ai✔️ Соавтор архитектуры Transformer выпустил модель для кодинга Rnj-1.Стартап Essential AI, основанный Ашишем Васвани, представил модель с открытыми весами Rnj-1. При размере всего в 8 млрд. параметров, она демонстрирует топовые результаты в SWE-bench Verified. Rnj-1 набрала 20,8 балла, тогда как аналогичная по размеру Qwen 3 (8B) достигла лишь отметки в 4,5.В основе новинки лежит архитектура Gemma 3. Разработчики намеренно отказались от упора на пост-трейн и RL. Вместо этого, команда сфокусировалась на качественном предобучении с использованием оптимизатора Muon. Веса базовой и instrust-версии доступны на HF.essential.ai✔️ NVIDIA представила крупнейшее обновление CUDA с 2006 года.Вместе с релизом CUDA 13.1 компания запускает виртуальный набор инструкций для "тайлового" параллельного программирования. Новая парадигма абстрагирует низкоуровневые детали

9 дек. 2025 г.82В Telegram

✔️ IBM совершила прорыв в квантовых вычислениях: на обычных FPGA-чипахВсего через два дня после новости от Google - ещё один крупный квантовый прорыв.IBM заявила, что один из её ключевых алгоритмов квантовой коррекции ошибок теперь способен работать в реальном времени на FPGA-чипах AMD, без использования экзотического оборудования. Это делает квантовые вычисления быстрее, дешевле и ближе к практическому применению, чем ожидалось.Алгоритм, который отслеживает и исправляет ошибки кубитов «на лету»,показал производительность в 10 раз выше необходимой, что стало важным шагом к созданию квантового компьютера Starling, запланированного на 2029 год.Теперь IBM утверждает, что проект идёт на год впереди графика.Исследовательская статья выйдет в понедельник.Темп развития квантовых технологий заметно ускоряется.reuters✔️ Microsoft представила AI-браузер Edge - ответ на OpenAI AtlasЧерез два дня после запуска OpenAI Atlas Microsoft представили обновлённый браузер Edge с новым режимом Copilot Mode. Это полноценный AI-бразуер, который понимает контекст вкладок, выполняет действия и способен продолжать проекты, используя историю пользователя.Функция Actions позволяет голосом или через чат открывать страницы, находить нужную информацию, отписываться от рассылок и даже бронировать рестораны. Система Journeys группирует прошлую активность по темам и помогает вернуться к незавершённым задачам, предлагая логичные следующие шаги. Включение Page Context даёт Copilot доступ к истории для более точных и персонализированных ответов, однако это остаётся опциональной функцией, которую можно отключить в любой момент.Edge также получил встроенный AI-защитник от фейковых всплывающих окон, менеджер паролей с проверкой на утечки.Браузер уже доступен в странах, где работает Copilot, на Windows и macOS.Microsoft✔️ Google добавили reasoning в Google EarthGoogle представила фреймворк Geospatial Reasoning на базе Gemini, который объединяет предиктивные модели и данные в единую систему анализа Земли.Теп

25 окт. 2025 г.89В Telegram

🖥 gpt-oss работает на специальном формате промптов — Harmony, и без него модель просто не будет выдавать корректные ответы.Зачем нужен Harmony? Этот формат нужен для:— 🧠 генерации chain of thought рассуждений — 🔧 корректного вызова функций и использования инструментов — 📦 вывода в разные каналы: обычный ответ, reasoning, tool call — 🗂️ поддержки tool namespaces и иерархических инструкций 💡 Harmony имитирует OpenAI Responses API, так что если вы с ним работали — будет легко освоиться.👉 Если вы используете gpt-oss через HuggingFace, Ollama или vLLM, волноваться не нужно. Но если строите свой пайплайн — обязательно изучите гайд по Harmony. Без него модель просто не будет работать как надо. pip install openai-harmony# or if you are using uvuv pip install openai-harmony@ai_machinelearning_big_data#gptOSS #Harmony #OpenAI #LLM #PromptEngineering

6 авг. 2025 г.107В Telegram

🌟 LLM Speedrunning Benchmark: ИИ-ассистенты пока не способны улучшить код, написанный человеком.Пока одни восхищаются способностью ИИ писать код по текстовому описанию, в компании Марка Цукерберга решили устроить ему настоящее испытание на профессионализм и создали «The Automated LLM Speedrunning Benchmark» — полигон, где нейросетям предлагается не просто написать что-то с нуля, а воспроизвести и улучшить уже существующий код.В качестве задачи был взят реальный проект NanoGPT, где сообщество энтузиастов соревнуется в максимальном ускорении обучения GPT-2, небольшой языковой модели. Цель - не просто скопировать, а понять и применить конкретную оптимизацию, которую до этого внедрил человек.🟡Суть экспериментаИИ-агенту дают исходный скрипт предыдущего рекордсмена и подсказку одного из 3 уровней: от псевдокода с описанием изменений до полноценной мини-статьи, объясняющей суть улучшения. Агент, получив эти данные, должен внести правки в код так, чтобы приблизиться к скорости обучения следующего рекордсмена.Эффективность мерили метрикой FSR (Fraction of Speedup Recovered), это доля восстановленного ускорения. Если человек ускорил процесс на 10 минут, а ИИ смог добиться ускорения в 5 минут, его результат — 50% FSR. Такая система позволяет оценить не абстрактные способности модели, а ее умение работать с конкретными, практическими задачами по оптимизации.🟡РезультатыИтоги оказались, мягко говоря, отрезвляющими. Даже топовые модели (Claude 3.7 Sonnet и Gemini 2.5 Pro), показали очень скромные результаты.С лучшими подсказками (псевдокод и детальное описание) самые успешные агенты с трудом смогли воспроизвести хотя бы 40% от прироста производительности, достигнутого человеком. Без подсказок их производительность была и вовсе близка к нулю.Разбор полетов бенчмарка показал, что ИИ-агенты часто генерируют либо просто неработающий код с ошибками времени выполнения, либо код, который компилируется, но не дает никакого прироста скорости, а иногда даже замедляет процесс.🟡ФреймворкА

3 июл. 2025 г.130В Telegram

🦾 Berkeley Humanoid Lite — открытый человекоподобный робот Калифорнийский университет Беркли представил проект Humanoid Lite — результат многолетних исследований и экспериментов по созданию простых в производстве человекоподобных роботов.Платформа полностью придерживается принципов Open Hardware: в ней используются свободно распространяемое ПО, серийные комплектующие, доступные в розничной продаже, а также детали, напечатанные на 3D-принтере. 🌟 100 % open-source под MIT-лицензией: прошивки, схемы, BOM, STL-модели, RL-контроллеры ✔️ Open Hardware: доступные в рознице электро- и мехкомпоненты, детали печатаются на обычном FDM-принтере ➡️ Итоговая стоимость сборки — примерно 5 000 USD ⭐️ Модульная конструкция: легко превращается в квадропода или «кенавроподобного» робота ➡️ Экосистема: Isaac Lab / Isaac Sim / MuJoCo, телеметрия через SteamVR-контроллеры ⏩ Что доступно:- Исходный код робота на C++ и Python - Модели машинного обучения для контроллера движений - Чертежи пластиковых деталей - Полный список комплектующих с ссылками на покупку - Пошаговый сборочный план - Симуляционные окружения для тренировки и запуска робота 🌟 Что робот умеет уже сейчас - локомоция: RL-контроллер приводит в заданную точку - телеприсутствие: человек управляет манипулятором через VR-контроллеры - навигация: экспериментальные алгоритмы обхода препятствий - поддержка мелкой моторики🔥 Как удалось удешевить:- пластиковые шестерни, напечатанные на 3D-принтере - циклоидные редукторы, повышающие надёжность пластика - использование типовых драйверов и контроллеров без кастомных плат *Clone → Print → Build → Hack!* 🤓🔜 Проект🔜 Код🔜 Схемы@ai_machinelearning_big_data#robots #ai #ml #opensource

28 апр. 2025 г.146В Telegram

🔥 «Упражнения по машинному обучению»В этой книге более 75 упражнений. И она абсолютно БЕСПЛАТНА.🔗 Книга🔗 GitHub@machinelearning_books

4 апр. 2025 г.238В Telegram

Машинное обучение / ИИ Бибилиотека

Похожие каналы

Последние посты