xaker

«Яндекс» открывает библиотеку YaFSDP для обучения больших языковых моделей

  • четверг, 13 июня 2024 г. в 00:00:12
https://xakep.ru/2024/06/11/yafsdp/
Компания «Яндекс» выложила в опенсорс библиотеку YaFSDP, которая ускоряет обучение больших языковых моделей — как собственной разработки, так и сторонних, с открытым исходным кодом. Библиотека дает ускорение до 25% (результат зависит от архитектуры и параметров нейросети). С помощью YaFSDP можно расходовать до 20% меньше ресурсов графических процессоров (GPU), которые требуются для обучения.