Яндекс выложил на GitHub свою библиотеку YaFSDP, которая ускоряет обучение LMM собственной разработки, а также сторонних моделей с открытым исходным кодом. Степень ускорения, которую обеспечивает YaFSDP, зависит от параметров и архитектуры нейросети.
Помимо сокращения времени на обучение библиотека поможет снизить расход ресурсов графических процессоров до 20%.
YaFSDP ориентирована, прежде всего, на LLM, однако подходит и для нейросетей для генерации изображений. Библиотека оптимизирует расход мощностей на всех этапах обучения: от pre-training до alignment.
YaFSDP создана в ходе обучения YandexGPT 3. Разработчики протестировали библиотеку на сторонних нейросетях с открытым исходным кодом.
Источник: RB.RU.
Изображение для превью новости предоставлено Freepik.