
Новость дня
@neuralguys
Авторский канал о нейросетях для самых маленькихFounder: refsee.com, paithology.com, fancyshot.comКонтакт для связи: @peterbond

Новость дня
Машин Лёрнинг в OpenAI:Мы взяли 10 миллиардов изображений и обучали на них 2 недели нашу кастомную модель на 256 GPUМой Машин Лёрнинг:
Просто магия какая-то. Работающий брейн-интерфейс от NextMind, который не требует вживления электродов в мозг, а просто крепится на шапку и касается головы своими контактами. Он уже позволяет силой мысли управлять интерфейсом и взрывать головы врагов в VR-играх. Это, господа, будущее. Функционал пока ограничен, но вы вспомните функционал первого айфона — революция не происходит за один день. Для управления умными очками или даже VR-шлемом это идеальное решение. Осталось разобраться с UX, и научить людей этим пользоваться, а то пока я как дурак смотрю на инструкцию "сконцентрироваться на кнопке" и просто начинаю *смотреть на кнопку интенсивнее*.Полный обзор по ссылке.
Наткнулся на алгоритм TagMe который вызывает ощущение дискомфорта фактом своего существования: Скармливаете ему GPS-координаты точки которая двигается и видео того места где были записаны эти координаты, TagMe после этого показывает на видео автоматом где именно тот объект данные которого вы отслеживаете. Мечта всяких там тоталитарных режимов 😓Страница проекта: https://people.csail.mit.edu/songtao/tagme.html

OpenAI выложили еще несколько моделей CLIP, а также опубликовали статью (https://distill.pub/2021/multimodal-neurons/), в которой, помимо прочего, делается смелое утверждение "In 2005, a letter published in Nature described human neurons responding to specific people. We report the existence of similar multimodal neurons in artificial neural networks" и приводятся наглядные визуализации "искуственных нейронов" (sic). В статье есть ссылки на какой-то невероятный инструмент визуализации - OpenAI Microscope (например, https://microscope.openai.com/models/contrastive_4x/image_block_4_5_Add_6_0/34)#AI
Пришло время собрать воедино все полезные и нужные нейронки, доступные на сегодняшний день в один пост (а после ваших каментов в лонгрид). Главное правило данной подборки — без пердолинга на всяких гугл.колабах, не сырые говнокостыльные скрипты и технологии, а доступные и полезные сразу либо в аппе, либо онлайн, либо на пк ДЛЯ ПРОСТЫХ ЛЮДЕЙ.God-tier (очень нужные и полезные уже сегодня):Nvidia Broadcast — 100 из 10 вещь для стриминга и блогинга «на коленке». Убирает шумы с микрофона и фон из вебки (или блюрит его). Работает в реалтайме и требует видеокарту с RTX. Sticker Mule 2 + remove.bg — пока что лучшие удалятели фона с фоток (не считая встроенного в фотошоп)Remini — пока что лучший увеличиватель фоток хуевого качества. Есть на всех платформах + плагин для браузера. Второй по лучшести — https://letsenhance.io/Namelix — генератор названий и логотипов. Работает только с латиницей, но результаты отличные.Colorize + 9 мая — раскрашивает черно-белые фотки.Lensa — самый простой апп для улучшения фоток в 2 клика. Refsee — поиск рефов по видео (для обычных людей бесполезно).AutoDraw — авторисователь от гугла. Можно будучи криворуким довольно быстро нарисовать простую иллюстрацию.Useless-tier: generated.photos — генератор несуществующих людей + ThisPersonDoesNotExist + то же самое с котамиYandex SpeechKit — генератор голосовДиктор Mail — генератор дикторов с озвучкойMyHeritage — «оживляет» любые фотоFaceApp — ну тут все ясно.ReflectTech — один из лучших фейссвапперов
Ну наконец-то, разработчик Modbox реализовал очевидную идею, лежащую на поверхности.Соединить вместе Windows speech recognition, GPT-3 AI и сервис Replica, который делает обратную конвертацию из текста в речь. Таким образом, можно общаться с нпс как с осмысленными персонажами. Т.к. все работает через облако, есть небольшой лаг.Я, честно говоря, на заре сервисов Гугл и Амазон думал, что это будет реализовано через них, но так тоже неплохо. Ждём официальной интеграции от гигантов, и вот тогда начнется всеобщее воспитание ИИ, а к чему это обычно приводит, мы все знаем))
Интересный факт: весь код DALL-E – 246 строчек.
Просто оставлю это здесь.OpenAI выложили DALL-E!Вот это сейчас, конечно, начнется волна приколдесов с картинками.https://github.com/openai/DALL-E
В FAIR RL-агента обучили управлять объектами по видеотьюториалам. Стандартные RL-алгоритмы обучаются задаче итеративно через обучение на ошибках. Предложенный алгоритм выучивает модель среды, наблюдает за поведением человека, а затем определяет функцию вознаграждения. Такой подход к обучению RL-агентов называется обратным обучением с подкреплением, основанным на модели среды (MBIRL).