Неожиданное нечто. Модель в данный момент учится на карточке RTX 5090, которая была куплена за 658к.И у нее от нагрузки началось расплавление Коннектора доп питания. Кто нибудь знает, чё с этим делать? Даунвольтить?
Заметки беснующегося разработчика
@cringe_os
Ничего такого, кроме пространных разговоров и разработки тут не будет.
Похожие каналы
Все →Последние посты

Накодил платформу и доволен
У таймвеба клюнуло облако после начала ддос, сервак в отрубе, впн пропал, пришлось костылить. Задумался поэтому о том, что даже для августовского ЗБТ придется строить инфраструктуру, которая сейчас в зачаточном состоянии, эх
После SFT - пойдет DPO. По сути, это практика, там с моделью будет общаться другая модель, и смотреть, насколько правильно отвечает моя модель. Просто есть нюанс, после SFT модель будет отвечать, но если что то знать не будет - начнет пиздеть и галлюцинировать, а мы этого не хотим и оно нам не надо воооот. Такие дела
Возымел я некоторый проеб:Я тут обозвал литературу пост-тренингом и допустил ошибку - по факту, это все ещё пре-тренинг, я просто даю модели правильную стилистику диалога.Проеб небольшой, такой pre-тренинг дороже, но он лучше в плане качества. Че буду делать:SFT - Я возьму и смешаю датасеты: 70% - обучение модели вести диалог, 30% - та же литература. Зачем?А чтобы модель научилась чатингу. Вопрос-ответ будут работать и можно будет начать первое ЗБТ, оно же закрытое бета тестирование. Про него расскажу, как модель будет готова. Но, это не конец ее обучения.
Пост-тренинг - мы научим ее вкладывать в свои слова смысл. В русском языке эталон смысла - русская классическая литература. Вот её и возьмем, данных немного, но нам много и не надо, все таки она не с 0 учится, мы дообучаем ее.Второй этап пост-тренинга - чатинг. Все привыкли к вопросно-ответной форме диалога, но модель не сильно одупляет, зачем вы вообще что то на вход ей пишете, она была бы счастлива генерировать хуйню бесконечно - почти как героиновый наркоман, которому наркоту впрыскивают в вену через автомобильную форсунку, так что загоним ее в рамки диалога. Научим ее чатится, поглядим как оно будет работать - если все пойдет тип-топ, получится годно.

Итак, этап пре-тренинга завершён, на удивление, модель очень уверенно шпарит по русски, но абсолютно бессмысленно, это нормально.Давайте чут чут упрощу и поясню, чего вообще случилось.Смотрите, когда модель только написана и собрана, по сути, это штука умеет просто генерировать шум. Абсолютно рандомный вывод символов. Сама модель состоит из токенизатора(типо словарика со словами, но слова не подписаны - она не знает, что они означают)И слоев - по сути мозги. Пре-тренинг - в моем случае, я взял просто датасет из кучи русского текста, чтобы модель:- Начала заполнять словарик- Узнала как строить предложенияПо сути у нее был огромный диктант, где диктующий иногда пропускал слова и предлагал модели найти наиболее релеватное слово. Модель угадывала, и чем ближе к правильному ответу, тем сильнее ее гладили по голове. Так она +- догнала как говорить по русски. Но, итог пре-тренинга, по сути, как младенец Господа, он говорить умеет, но вложить смысл в слова не может. Теперь про пост-тренинг.

Начальство сказало, что завтра нужен аналог дипсик.Штош.....
Если дать ей Достоевского, модель зарубит бабку за долги или впадет в депрессию? Хмммм....
Если что, это нормально, что она несет бессвязный бред, это этап пре-тренинга, она сейчас читает и учит огромный датасет из статей, реклам и всего такого.Уже на пост-тренинге моделька начнет писать литературным языком, и научится именно чатится, сейчас это скорее учат младенца языку просто. Остечка по актуальности: май 2024. Потом закину актуальные данные. Контекстное окно: 8к токенов
МУЖИКИПЕРВЫЙ ПАТЕНТ НА СОФТ ПОЛУЧИЛ. ОТ CERN. Ахуеть.
Мужики, а кому нибудь DevSecOps/SRE инженер с 2 годами опыта не нужон? Могу резюме скинуть.
Так как влесс у нас дружно дохнет под нагрузкой поумневшей ТСПУ, переехал на Hysteria. Спустя миллион итераций починки конфига и поднятия сокс5 тоннеля смог даже завернуть гугловый траффик Ютуб и ру сервисов через российскую впс, так как для меня дичайший гемор нажать три кнопки и выключить впн при входе в госуслуги
Мужики, я познал дзен полной автоматизации реагирования на проблемы в инфре, через локальные моделиЗабавно, презентовал начальству, сказали перевести разработку в закрытый режим и избегать утечек. Это он типо важный стал?

Мужики, я познал дзен полной автоматизации реагирования на проблемы в инфре, через локальные модели

Мужики, нет ничего лучше, чем любящая жена на 14 февраля!Спасибо ей большоеМужики, нет ничего лучше, чем любящая жена на 14 февраля!Спасибо ей большое

Ну а для начала централизованного управления хостами и ВМками, восстановим общее управление системами через VCenter. По его API к нему коннектится Terraform - в нем вы можете описать, как должна работать ВМ и/или сервис. Терраформ дальше сам развернет и будет поддерживать ВМ в заданном состоянии.

Приводим инфраструктуры из состояния работоспособных руин в приятный отказоустойчивый цех, день первый:Так как в базе я уже развернул централизованную графану и имею ряд кастомных экспортеров на 1/20 машин, то начну постепенно:- Восстановим полную систему мониторинга инфраструктуры и углубим алертинг- Увеличим сеть экспортеров.- Начнем подготовку к переходу всей инфраструктуры к IaaC решениям от HashiCorp: Vault, Terraform, Nomad, Consul. - Обеспечим мониторинг, причем не только на предмет жизнедеятельности, но и системных событий.

Ну вот и кончаются мои рабочие будни старшим сисадмином, посмотрим, как будем барахтаться дальше)

Вот это я понимаю, действительно отчаянный поиск рабочего конфига впн в инете