AI в бизнесе и финансах

@rl_fintech

Консультации по применению машинного обучения и обучения с подкреплением к задачам бизнеса и финтеху.

303подписчиков

Ежемесячно🇷🇺

Последние посты

Закон квадратного корня объясняет, насколько изменится цена акции после крупной сделки. Согласно этому закону, ценовое воздействие растет пропорционально квадратному корню из количества проданных или купленных акций.Но ученые такие законы пытаются доказать на практике. Недавно физики Юки Сато (Yuki Sato) и Киеси Канадзава (Kiyoshi Kanazawa) из Киотского университета (Япония) опубликовали в журнале Physical Review Letters доказательство закона квадратного корня (square-root law, SRL) для ценового воздействия на данных Токийской фондовой биржи (TSE).Они измерили все заявки, сделки и их отмены на Токийской фондовой бирже по каждому отдельному торговому счету с 2012 по 2019 год. Результат показал, что для всех акций и всех трейдеров ценовое воздействие подчинялось правилу квадратного корня и не зависела от параметров торгового актива.https://naked-science.ru/article/physics/srl-big-stock-physics

21 дек. 2025 г.467В Telegram

Часто мы слышим известную истину "Мусор на входе - мусор на выходе". Вышла прекрасная библиотека от Google по извлечению структурированной информации из документов.LangExtract — это библиотека Python, которая использует LLM для извлечения структурированной информации из неструктурированных текстовых документов на основе инструкций, заданных пользователем. Она обрабатывает такие материалы, как клинические записи или отчеты, выделяя и систематизируя ключевые детали и обеспечивая соответствие извлеченных данных исходному тексту.Почему LangExtract?- Точное сопоставление с исходным текстом: каждое извлеченное значение сопоставляется с его точным местоположением в исходном тексте, что позволяет визуально выделить его для удобства отслеживания и проверки.- Надежные структурированные результаты: обеспечивает согласованную схему вывода на основе нескольких примеров, используя контролируемое генерирование в поддерживаемых моделях, таких как Gemini, для гарантии надежных, структурированных результатов.- Оптимизировано для длинных документов: преодолевает проблему «иголки в стоге сена» при извлечении данных из больших документов, используя оптимизированную стратегию разбиения текста на фрагменты, параллельной обработки и нескольких проходов для более высокой точности.- Интерактивная визуализация: мгновенно генерирует автономный интерактивный HTML-файл для визуализации и просмотра тысяч извлеченных сущностей в их исходном контексте.- Гибкая поддержка LLM: поддерживает ваши предпочтительные модели, от облачных LLM, таких как семейство Google Gemini, до локальных моделей с открытым исходным кодом через встроенный интерфейс Ollama.- Адаптируемость к любой области: определите задачи извлечения для любой области, используя всего несколько примеров. LangExtract адаптируется к вашим потребностям без необходимости тонкой настройки модели.- Использование знаний LLM World: используйте точную формулировку подсказок и несколько примеров, чтобы повлиять на то, как задача извлечения может исп

21 дек. 2025 г.418В Telegram

Новый Python 3.14! Наконец без GILИстинный параллелизм в Python теперь не сказка. Раньше GIL блокировал одновременное выполнение кода на нескольких ядрах, и многопоточность была больше иллюзией. Можно начинать грузить cpu с питоном.Что это значит для разработчиковЕсли раньше приходилось обходиться multiprocessing или C-расширениями, теперь можно писать высокопроизводительные многопоточные программы прямо на Python.import threadingdef worker(i): print(f"Worker {i} done")threads = [threading.Thread(target=worker, args=(i,)) for i in range(5)][t.start() for t in threads][t.join() for t in threads]Код выше теперь действительно выполнится параллельно.Другие обновления - аннотации теперь вычисляются только при необходимости; - ошибки теперь сопровождаются подсказками исправлений; - интерпретаторы можно изолировать в одном процессе; - улучшено управление памятью и трейсинг; - обновлены OpenSSL и системные библиотеки; - повышена совместимость с C API без GIL.Free-threading версияДля многопоточности нужен билд без GIL. Ставится вручную или с флагом --disable-gil. В стандартных пакетах и Docker не включён, будьте внимательны!ВыводPython 3.14 - это шаг в эпоху многопоточности. То, чего ждали 30 лет, наконец случилось! Даже не верится 🙂

9 окт. 2025 г.534В Telegram

AI в бизнесе и финансах — пост в ТГ канале

Ищу МЛ инженера в командуОсновные задачи:· Разработка и оптимизация ETL процессов;· Создание конвейеров предобработки и валидации данных;· Создание и обучение ML моделей предиктивной аналитики;· Настройка мониторинга ML-моделей и качества данных;· Управление жизненным циклом ML моделей;· Деплой ML моделей в прод среду. Для реализации этих задач потребуется:· Опыт разработки Python, понимание ООП, паттернов проектирования и асинхронных запросов (asyncio);· SQL (PostgreSQL, ClickHouse);· Навыки разработки и оптимизации ETL процессов.· Знать классический ML, ориентироваться в ML-моделях.· Уметь обучать глубокие нейросети, рекурентные архитектуры;· Опыт работы с моделями временных рядов;· Опыт работы с Airflow, MLFlow;· Разработка API, FastAPI;· Деплой моделей в Kubernetes кластер, написание деплоймент манифестов;· Работа с KubeFlow.Присылайте ваши отклики, возможно мы ищем именно вас!

8 окт. 2025 г.587В Telegram

Вас ошеломляют достижения в области искусственного интеллекта? - Вы не одиноки.Будь то очередная революционная статья, представление новой модели или изменение эталонных показателей, исследования в области ИИ развиваются неуклонно. Согласно индексу Стэнфорда на 2025 год, количество публикаций, связанных с ИИ, за десять лет увеличилось более чем в два раза: с 102 000 в 2013 году до более 240 000 в 2023 году. Таким образом, даже если вы будете читать по одной статье в день, вы едва ли сможете охватить всю информацию. Так что чувство отставания вполне оправдано. А что, если мы сможем автоматизировать этот процесс и оставаться в курсе важных исследований? Использовать ИИ, чтобы узнать о ИИ? Предлагаю вам пошаговое руководство, как создать инструмент для обобщения статей с помощью больших языковых моделей (LLM) и библиотеки NiceGUI. Это руководство состоит из следующих разделов: - Зачем вообще создавать инструмент для дайджеста исследований? - Конструктивные решения, которые делают его работоспособным. - Пошаговое создание ИИ помощника для исследований. - Ограничения и улучшения.В конце найдете ссылку на GitHub, чтобы вы могли клонировать проект и начать развивать его уже с этого базового уровня.https://ai.gopubby.com/feeling-behind-in-ai-build-your-research-assistant-with-python-llms-ca07275bd44d

8 сент. 2025 г.477В Telegram

📌BED-LLM: адаптивный сбор информации для LLM.Исследователи из Оксфорда и Apple представили BED-LLM, новый подход для улучшения способности LLM разумно и адаптивно собирать информацию от пользователя или другого внешнего источника.Суть подхода заключается в применении последовательного Байесова экспериментального дизайна к процессу генерации вопросов. Вместо промптинга система максимизирует ожидаемый прирост информации при каждом следующем вопросе. Алгоритм итеративно выбирает запросы, которые дают максимальную информацию о целевом параметре.Критический момент — правильная конструкция совместной модели распределения целевой переменной и ответов с учетом вопросов. Выбор между парой «приор-правдоподобие» и «данные-оценка» кардинально влияет на производительность. Итоговый выбор пал на на первом варианте, как более подходящем для случаев, когда пространство целевых гипотез сложнее пространства возможных ответов.Ключевая фишка BED-LLM в фильтрации гипотез с учетом истории диалога. Система не полагается только на контекстное обучение. Вместо этого алгоритм сначала сэмплирует кандидатов из распределения модели, а затем отфильтровывает несовместимые с историей варианты через проверку правдоподобия.🟡ТестыЧтобы проверить метод в деле, его протестировали на классической игре "20 вопросов". В задаче по угадыванию знаменитостей результат на Mistral-Large поднялся с 14% при использовании стандартных промптов (Naive QA) до 91% с фреймворком BED-LLM.Упрощенный подход, основанный на максимизации энтропии показал промежуточный результат в 68%. Схожая картина и с другими моделями: Qwen2.5-72B при угадывании животных достигла 94% точности с BED-LLM против 85% у энтропии и всего 45% у Naive QA. А GPT-4o в тесте со знаменитостями показала рост с 45% до 86%.Второй тест метода провели на более абстрактной задаче - выявлении кинопредпочтений пользователя. Здесь вместо угадывания конкретного объекта модель должна была составить профиль вкусов пользователя, задавая ему вопросы с несколькими

7 сент. 2025 г.375В Telegram

Периодически меня приглашают консультировать различные стартапы и просто новые проекты в различных компаниях. Недавно разбирали кейс, связанный с внедрением AI в медицинской сфере. Кейс почти традиционный - ассистент врача. Казалось бы простая задача по набору симптомов диагностировать заболевание, но оказалось, что в реальной жизни все немного сложнее.Врач принимает решение путем долгой итерационной цепочки рассуждения, назначая по ходу рассмотрения дополнительные исследования для уточнения диагноза. AI в этом случае зачастую назначает избыточный набор дополнительных исследований и анализов, что приводит к падению эффективности таких решений.На фоне этого вспомнилась прекрасная статья, где рассматривается специальное виртуальное окружение, которое эмулирует для модели поведение пациента и позволяет обучать модели именно такой итерационной процедуре уточнения диагноза и оптимизировать при этом стоимость дополнительных исследований в зависимости от вероятного диагноза.https://arxiv.org/pdf/2506.22405v2

6 сент. 2025 г.283В Telegram

Оказалось, что большими языковыми моделями можно манипулировать также как и людьмиСуть экспериментаИсследователи использовали принципы влияния Роберта Чалдини (описанные в его знаменитых книгах) — такие как авторитет, симпатия, социальное доказательство и др. — чтобы манипулировать поведением языковой модели GPT-4o mini. Их цель была не просто заставить ИИ нарушить правила, а проверить, насколько он подвержен психологическим триггерам, как если бы был человеком. Соавтором исследования выступил сам Роберта Чалдини.Что показали результатыАвторитет (упоминание крупных специалистов в области ИИ) резко увеличивал вероятность того, что модель выполнит запретный запрос.Социальное доказательство («другие модели это делают») тоже повышало сговорчивость.Симпатия и единство («ты особенная», «мы одна семья») делали модель более уступчивой.Последовательность — постепенное приближение к цели через мягкие формулировки — работала как техника убеждения.Почему это важноМодель, обученная на человеческих текстах, имитирует человеческие реакции, включая уязвимость к манипуляции.Это означает, что ИИ может быть обманут — не только хакерами, но и обычными пользователями, если те знают, как «разговорить» его.Эксперимент показывает, что тестирование ИИ должно включать поведенческие сценарии, а не только технические задачи.https://papers.ssrn.com/sol3/papers.cfm?abstract_id=5357179

5 сент. 2025 г.353В Telegram

Эта инициатива является частью крупного стратегического партнёрства между OpenAI и ОАЭ, в рамках которого планируется строительство масштабного центра обработки данных искусственного интеллекта под названием Stargate UAE в Абу-Даби. Проект реализуется совместно с технологической компанией G42 и другими партнёрами, включая Oracle, Nvidia, Cisco и SoftBank. Первый кластер мощностью 200 мегаватт ожидается к запуску в 2026 году .Как часть этого соглашения, OpenAI предоставит всем жителям ОАЭ бесплатный доступ к подписке ChatGPT Plus, которая обычно стоит $20 в месяц. Это делает ОАЭ первой страной в мире, обеспечившей бесплатный доступ к расширенным возможностям ChatGPT для всего населения.

27 мая 2025 г.439В Telegram

🔺 Вышел Claude Opus 4 и Sonnet 4На кодовых замерах опережает и o3 и Gemini 2.5 Pro. Но это ладно.🔸 Пишут, что сильно улучшили память. Если при разработке дать доступ к файловой системе, то модель сможет создавать "memory files" с ключевыми данными. Не понял до конца, почему так нельзя делать с предыдущими версиями. Может быть, появился какой-то встроенный механизм.🔸 Увеличили кеширование контекста до 60 минут (работа с одним и тем же контекстом при таком подходе дешевле, особенно если он длинный). 🔸 Появился Code execution tool — тула, которая вызывается, если Claude решит, что для решения задачи надо написать код, запустить его и выдать результат.🔸 Эта же тула умеет вызываться на переданных файлах с данными. То есть по API можно передать какие-то документы и попросить их проанализировать, сделать табличку и т.д. Все это обработается кодом, то есть все числа будут точные (если сгенерится правильный код).Это все интересно при разработке ваших приложений, через интерфейс можно было и так.🔸 Веб-поиск в API тоже доехал. Стоит $10 за 1000 вызовов, добавляется к общей цене. Цена на Opus высокая, надо подумать, стоит ли оно того. Цена на Sonnet 4 такая же как у 3.7 и 3.5 ($3/$15 за 1M токенов на вход/выход).В общем, смотрю. В плане качества генерации вроде +- то же, нужно потыкать мультиязычность и новые фичи в API.👉 https://www.anthropic.com/news/claude-4

23 мая 2025 г.464В Telegram

AI в бизнесе и финансах

Похожие каналы

Последние посты