Just links

@j_links

That's just link aggregator of everything I consider interesting, especially DL and topological condensed matter physics. @EvgeniyZh

6 783подписчиков

🇬🇧

Открыть в Telegram

Последние посты

First Proof Second Batch https://1stproof.org/assets/docs/report.pdfhttps://github.com/eth-sri/proof-council/blob/main/ProofCouncil.pdf

12 июн. 2026 г.1 720В Telegram

Oasis 3 The Interactive World Model for Physical AI https://decart.ai/oasis

11 июн. 2026 г.1 770В Telegram

https://www.ecdsa.fail/

11 июн. 2026 г.1 790В Telegram

First Proof Second Batch https://1stproof.org/assets/docs/report.pdf

11 июн. 2026 г.1 780В Telegram

Handbook of Error-Correcting Codes https://arxiv.org/abs/2606.11484

11 июн. 2026 г.1 730В Telegram

The Invisible Hand of Physics: When Video Diffusion Models Know More Than They Show https://arxiv.org/abs/2606.05328

10 июн. 2026 г.1 740В Telegram

SWE-Marathon https://www.swe-marathon.org/

9 июн. 2026 г.1 830В Telegram

Oxygen-centred planar orbitals in the electronic structure and spin-density-wave reconstruction of multilayer nickelates https://www.nature.com/articles/s41567-026-03286-4

9 июн. 2026 г.1 620В Telegram

Efficiently Reconstructing Dynamic Scenes One D4RT at a Time https://arxiv.org/abs/2512.08924

8 июн. 2026 г.1 570В Telegram

NitroGen: An Open Foundation Model for Generalist Gaming Agents https://arxiv.org/abs/2601.02427

8 июн. 2026 г.1 570В Telegram

Agents' Last Exam https://agenthle.org/leaderboard

7 июн. 2026 г.1 830В Telegram

Engineering Quantum Criticality in the Integer Quantum Hall Regime through a Screening Layer https://arxiv.org/abs/2605.30129

7 июн. 2026 г.1 720В Telegram

LEAP: Supercharging LLMs for Formal Mathematics with Agentic Frameworks https://arxiv.org/abs/2606.03303

6 июн. 2026 г.1 740В Telegram

Прочитал интересную (и применимую) статью Rethinking Early Stopping: Refine, Then Calibrate.Часто в курсах по машинному обучению говорят, что ошибку системы можно разложить на bias, variance, noise. На некоторых редких курсах даже учат, как это считать и что с этим делать дальше.Попробуем посмотреть на эту проблему с другой стороны. В задачах вероятностной классификации loss для proper scoring rules можно разложить на: calibration и refinement.Калибровка — мы сказали, что вероятность 80%. Сколько из взятых образцов будут принадлежать к классу 1? (Считать это можно через ECE — Expected Calibration Error).Refinement — насколько хорошо модель разделяет классы. Допустим, модель выдала скор 0.9, все образцы оказались класса 1, а все, что ниже — класса 0. Модель откалибрована так себе, но разделяет классно. Собственно, если бы модель была откалибрована, мы могли бы выбирать отсечку вероятностно через саму вероятность.Легко представить и обратную ситуацию: модель прекрасно откалибрована, но разделяет плохо. Например, модель, которая всегда предсказывает вероятность 50% для честной монетки, идеально откалибрована, но её разделяющая способность минимальна.Из чего делаем вывод, что в какой-то момент улучшение функции потерь, из тех что относятся к семейству proper scoring functions, может происходить лишь за счет улучшения калибровки или даже ухудшать разделение, но за счет большого по величине улучшения калибровки выдавать лучший скор.Это плохо. Калибровку часто можно существенно поправить потом post-hoc методами, поэтому остановка обучения по лоссу на валидации может привести к ситуации, что мы взяли далеко не лучший чекпойнт.Что делать?Сохранить несколько чекпойнтов модели.Откалибровать каждый из них одинаковым методом.Только после этого сравнивать их по loss.В таком случае для каждого чекпойнта мы отдельно минимизируем доступную calibration error выбранным post-hoc методом (ссылка на запись вебинара), а разница в loss начинает лучше отражать именно качество разделения кла

6 июн. 2026 г.1 470В Telegram

Scalable Concurrent Queues for GPU https://arxiv.org/abs/2606.01693

6 июн. 2026 г.1 440В Telegram

Just links

Похожие каналы

Последние посты