Вениамин Фишман

Вениамин Фишман

@fishmanvs

Генетика через призму AI, а также о науке (и в целом о жизни) в РФ и за рубежом

1 245подписчиков
🇷🇺

Похожие каналы

Все →

Последние посты

Последний раз в жизни я голосовал на трассе лет, кажется, в 20. Тогда я почему-то решил, что умение поймать попутку - это очень полезный социальный навык, который обязательно нужно попрактиковать - и неделю добирался с дачи до работы на перекладных.Сегодня мне в полной мере пригодились эти навыки. Потратив полтора часа на то, чтобы удостовериться, что такси в Дорохово (где проходила конференция) не приедет ни за какие деньги, а также выяснив, что гостиничное такси стоит дороже, чем мой билет на самолёт Москва-Новосибирск (это не преувеличение), я вышел на трассу с рюкзаком и стал ловить попутчика. Сначала местный селянин докинул меня до трассы Минск-Москва, а потом какой-то дачник подвёз до Сколково. Оттуда - на такси в Домодедово. Успел ровно к моменту посадки в самолёт. Что же, никогда не знаешь, где и когда пригодится навык из детства!

28 июн. 2026 г.902В Telegram

Выступаю на юбилейной конференции отдела ДНК-диагностики МГНЦ. Два фан-факта:1. Александ Владимирович рассказывал как когда-то в начале двухтысячных коллеги обнаружили в одной семье миссенс мутацию, сегрегирующую с наследственным заболеванием зрения. В семье было трое больных детей. В очередной репродуктивный цикл сделали ПЦР-тест и выбрали эмбрион без мутации. Родился здоровый ребенок - это был большой успех (сейчас такое делается рутинно, но тогда это было непросто). Через 15 лет коллеги из Польши на основе новых данных опубликовали статью о том, что этот вариант не является патогенным. Что было причиной болезни в той семье мы так и не узнаем )2. Ортодоксальные евреи не могут смотреть результаты своего ДНК-тестирования. Но ДНК-диагностику им как раз делать нужно чуть ли не больше всех, поскольку живущие много поколений в закрытых местечках евреи часто являются носителями редких патогенных генетических вариантов. В результате в Израиле есть специальная программа - Dor Yeshorim. В рамках нее скринируют молодых людей на частые (для данной группы) патогенные варианты. Вместо этого каждому дают идентификационный номер, а когда рассматривается потенциальный брак, номера двух людей проверяют в системе, и пара получает ответ примерно в формате: совместимы / не совместимы генетически.П.С. Мои поздравления Александру Владимировичу Полякову и его большой команде. Очень приятно окунуться в душевную атмосферу их отдела, и, конечно, огромная работа проводится в МГНЦ по медико-генетической диагностике, обучению врачей, популяризации и другим направлениям.

27 июн. 2026 г.1 090В Telegram

Я много рассказываю на этом канале о языковых моделях ДНК. Это направление вызывает большой интерес в академических исследованиях, однако широкое практическое применение в реальном секторе экономики эти модели пока не получили (см. также пост о первых попытках коммерциализации) .Сегодня стало известно, что авторы статьи Evo2 получили 50 млн долларов венчурных инвестиций на создание коммерческой компании, в основе которой лежит их усовершенствованная модель Omnii:https://www.radicalnumerics.ai/blog/radical-numerics-seedДля сравнения - это примерно 2 годовых бюджета большого академического института РФ, в котором работает несколько сотен научных сотрудников.

15 июн. 2026 г.1 440В Telegram

И ещё из интересных новостей - хочу подсветить вот эту заметку в Nature о генной терапии, в которой проводят "омолаживание" клеток вирусами, несущими факторы Яманаки. Это такие транскрипционные факторы, возвращающие взрослые клетки в эмбриональное состояние. Звучит немного фантастически, и к результатам дейтвительно нужно относиться с осторожностью - ряд работ, в том числе нашей группы, неоднократно показывал онкогенный потенциал этих факторов. Но данные авторов довольно обнадеживающие - "омоложение" клеток ретинального ганглия глаза у мыши в позднем возрасте позволяет запустить процесс регенерации глаза и излечивает от глаукомы.Недавно эта технология добралась до клинических испытаний. Факторы Яманаки введут 12 пациентам, чтобы проверить безопасность такой терапии

11 июн. 2026 г.2 120В Telegram
Вениамин Фишман — пост в ТГ канале

В твиттере развернулась интересная дискуссия вокруг этой статьиВкратце, статья показывает, что с увеличением размера и сложности модели, а также при увеличении количества данных для обучения, качество решения задач single-cell транскриптомики практически не меняется. И довольно большие модели работают не намного лучше простых методов вроде метода главных компонент.Этот результат вызывал много критики по отношению к создателям больших моделей от корифеев области - Sasha Gusev, Anshul Kundaje и других. Очевидно, что нам нужны новые архитектуры, режимы тренировки и, возможно, данные (хотя лично я считаю, что данных достаточно). Но я уверен, что решать задачи геномики при помощи AI возможно - и тот, кто придумает это решение, совершит огромные прорыв. Цитирую пост Anshul Kundaje On the other hand, if u provide a model that consistently delivers what it promises, everyone will keep their mouths shut & happily use it. Quite easy to make the case. The model should be able to speak for itself.

11 июн. 2026 г.1 460В Telegram

Продолжаю серию постов о том, как использовать агентов (Codex) с биоскилами (ClawBio) и наши модели для предсказания экспрессии генов, чтобы решать разные биомедицинские задачи.Вот тут мы показываем, как можно предсказывать in silico последствия делеции в промоторе.Кстати, помимо наших моделей очень рекомендую для этой цели PromoterAI от IlluminaП.С. в комментариях пишут, что PromoterAI не очень хорошо справляется со сложными кейсами. Так что не рекомендую. Не факт, правда, что наши модели лучше, в прямую не сравнивали ))

10 июн. 2026 г.1 150В Telegram

Я много занимаюсь 3D-геномикой и, как и в других разделах геномики, в этой области очень большая часть анализа делается не только статистическими/ML/биоинформатическими методами, но ещё и при "ручном" отсмотре данных в программе-визуализаторе (IGV, UCSC и т.п.). Для 3D-данных есть два стандартных инструмента – Juicer/Juicebox и CoolTools/Cooler. Недавно мне написала команда из ITMO, которая разрабатывает альтернативу - по словам авторов, в разы быстрее и исправляет некоторые недочёты этих инструментов. С удовольствием распространяю ссылку на их софт: https://github.com/ctlab/HiCT_JVM/releases Фидбек можно писать напрямую автору: @ntwwwntВот описание от авторов:Базово – это быстрый просмотрщик карт контактов: можно интерактивно перемещаться по Hi-C карте, менять масштаб, смотреть большие сборки, работать с разными разрешениями и дополнительными слоями данных. Особенно интересно, что по FASTA можно построить дотплот и визуализировать дотплот поверх Hi-C данных или открыть выше диагонали одну карту, а ниже диагонали – вторую. К тому же, это не просто read-only визуализатор, в HiCT доступны операции ручного скаффолдинга: можно и работать с самой сборкой – поменять порядок и ориентацию контигов. Дополнительно есть ещё очень много настроек визуализации, сложно, но функционально.Используется свой формат данных, за счёт чего и достигается высокая скорость работы, но на вход можно подать и привычные для этой области .hic или Cooler.

9 июн. 2026 г.1 120В Telegram

В данном ТГ-канале я уже отмечал, что изучение с помощью нейросетевых подходов текстов на «языке ДНК», т.е. последовательностей нуклеотидов в ДНК – очень перспективное новое направление, где можно ожидать реальных научных прорывов. И приводил в качестве примера ИИ-модель Evo 2, которая была разработана учеными расположенного в Калифорнии Arc Institute: https://t.me/khokhlovAR/1206 Эта модель была обучена на последовательностях ДНК более чем 100 тысяч видов живых организмов по всему древу жизни – от одноклеточных организмов до человека. В частности, я тогда отмечал, что «большие языковые модели обучаются на совокупности произведенных человечеством текстов, подавляющая часть которых не отличается особой мудростью. А последовательности нуклеотидов в ДНК были отобраны в ходе миллиардов лет эволюции, эти тексты будут явно поумнее, и обучение на них должно (по идее) приводить к намного более интересным результатам.» И вот совсем недавно я получил сообщение от доктора биологических наук В.С.Фишмана,  руководителя лабораторий Института цитологии и генетики СО РАН и Университета Сириус, а также группы геномики основанного Сбером Института искусственного интеллекта (AIRI). Он сообщил, что в России тоже активно ведутся исследования по анализу текстов на «языке ДНК». В прошлом году в Nucleic Acids Research была опубликована разработанная этой группой модель GENA-LM: https://academic.oup.com/nar/article/53/2/gkae1310/7954523 Об этой модели на русском языке и на очень популярном уровне можно прочитать здесь:  https://www.kommersant.ru/doc/7550813 Я попросил Вениамина Семеновича коротко сформулировать основные отличия этой модели от EVO 2. Вот его ответ: «GENA-LM и Evo-2 - две параллельные линии развития моделей для ДНК. Обе учатся на больших массивах геномных последовательностей и затем могут использоваться для широкого круга биологических задач. Технологически обе модели рассчитаны на анализ длинных последовательностей, но используют для этого разные подходы. Кроме того, Evo-2 -

7 июн. 2026 г.974В Telegram

Познакомился на прошлой неделе с Manuel Corpas из University of WestminsterОн разрабатывает ClawBio - репозиторий биологических агентов для LLM. Если сильно упростить, это просто набор текстовых инструкций к онлайн сервисам, ссылку на которые можно дать GPT - тогда модель сможет обращаться к этим сервисам при решении биологических задач.Поскольку коллеги из GI сделали API к нашей моделе для предсказания экспрессии, решил добавить этот API как инструкцию к ClawBio и протестировать. В общем сделал так: запустил Codex от ChatGPT и попросил (просто текстом, без кода) предсказать экспрессию для парочки промоторов в кроветворных и печеночных клетках. Работает! GPT понимает, что сам такое сделать не сможет, но у него есть инструкция как запустить стороннюю модель - он дергает за нее, получает предсказание и обсуждает со мной.Ок. Дальше попросил GPT сделать мутагенез последовательности промтора гемоглобина - написал такой промпт:Now I want you to modify this sequence to optimize expression in HepG2. Do this greedy:- introduce a random mutation- benchmark it with the GI expression model- if it increases expression in HepG2, keep it- otherwise discard it Your aim is maximum HepG2 expression. Report the best sequence and number of mutations it has compared to the reference sequence.GPT сам написал мне скриптик для этой задачи, который обращается к нашей модели экспрессии, и за 50+ мутаций сделал из промотора гемоглобина что-то, активное (по крайней мере модель так считает) в гепатоцитах!В общем пока что сами биомодели остаются бутылочным горлышком - например, у них у всех (включая наши) не очень хорошо с клеточной специфичностью предсказаний. Но модели постепенно совершенствуются - а инфраструктура для них уже есть.П.С. Полная версия поста про мои упражнения с ClawBio

6 июн. 2026 г.1 390В Telegram

Есть ли у кого-то контакты коллег из Eliava Institute (https://eliava-institute.org/en/structure) в Тбилиси? Мои колабораторы в США хотят с ними законектиться, но не могут найти актуальные контакты для связи.

4 июн. 2026 г.1 350В Telegram

Важное обновление для тех, кто работает с аннотацией генов и геномов!Мы подготовили целый пакет инструментов:- бенчмарк актуальных инструментов (обновляется в реальном времени) для ab initio аннотации- отдельный бенчмарк для сегментации генов (разметки экзон-интронной структуры)- пайплайн для анноатции генома на основе наших собственных моделей (топ согласно бенчмарку)- вебсервис, на котром можно посмотреть демо: наш и от наших коллег из GI- наши модели теперь доступны на HugginfaceРазработчики - @the_alexeys и @temchellooОтдельное спасибо за тестирование @YaraYaraCh, @All096, @vitdrav

3 июн. 2026 г.1 610В Telegram

Коллеги приглашают студентов из Новосибирска и окрестных городов принять участие в качестве преподавателей в летней школе по биологии. Школу эту я хорошо знаю и слышал о ней много позитивных отзывов, так что мне кажется это очень правильный способ немного подработать на летних каникулах.

29 мая 2026 г.1 490В Telegram

Добрый день! Приглашаем педагогов летом 2026 года провести очные практикумы/мастер-классы/лекции для обучающихся 14-17 лет в рамках проекта «ТехноЛето: прокачай навыки для НТО» (июнь–август).Проект направлен на подготовку обучающихся к следующему сезону Национальной технологической олимпиаде для того, чтобы погрузить ребят в навыки, которые им необходимо будет знать для участия в НТО.Важно! Все практикумы/мастер-класс/лекции от 2-4 часов, в очном формате, необходимо, чтоб подходили под задачи второго этапа НТО и междисциплинарностьПримеры тем: https://disk.yandex.ru/i/0wUtWWrRMCdgwQЗапись времени практикума: https://disk.yandex.ru/i/ty6Wvc8zP2m5VA Площадка проведения: РЦ «Альтаир», г. Новосибирск, Академгородок, Технопарк, ул. Николаева 12.По вопросам: Татьяна Владимировна, старший методист РЦ «Альтаир», 8-996-377-00-23

29 мая 2026 г.1 830В Telegram

Я рассказывал о наших моделях для поиска генов и предсказания экспрессии. Недавно выложили апдейт - теперь когда вы закидываете последовательность ДНК и описание эксперимента, модель сначала сама ищет где расположены гены, а потом для каждого гена предсказывает экспрессию. Можно пробовать тут.Я не пишу про каждое обновление вебсервиса на этом канале, поскольку аудитория тут разная, так что если вам интересны все новости - подписывайтесь на рассылку в этой форме.А в ближайше время я тут выложу ещё большой апдейт по нишим моделям и пайплайнам для геномной аннотации - stay tunned!

28 мая 2026 г.2 640В Telegram
Вениамин Фишман — пост в ТГ канале

Продлеваем дедлайн подачи заявок на «Лето с AIRI» до 29 мая 10:00 🔔Летняя школа по ИИ в этом сезоне пройдёт в Усть-Лабинске — окружённом живописной природой городе Краснодарского края. С 21 июля по 4 августа вас ждут лекции и семинары, постерная сессия, проектная работа и внеучебные активности — от спортивных соревнований до ламповых посиделок у костра. Отличная возможность прокачаться в области искусственного интеллекта, с головой погрузиться в исследования и попасть в классное комьюнити.Если вам нужно будет официальное приглашение на Школу (например, чтобы вуз помог с оплатой билетов), мы можем его оформить — просто напишите нам.Подавайте заявку и рассказывайте друзьям — это лето может стать ярким! Если у вас остались вопросы, пишите нам на event@airi.net 📌

26 мая 2026 г.1 510В Telegram