Яндекс улучшил нейросетевое сжатие

14 апреля 2025, 13:07 2 минуты

Новый метод сжатия больших языковых моделей позволит быстро получать результаты даже на смартфоне и ноутбуке

Совместными усилиями специалистов «Яндекс» из лаборатории Yandex Research, НИУ ВШЭ, MIT, KAUST и ISTA удалось разработать метод быстрого сжатия больших языковых моделей (LLM) без потери их качества, благодаря чему работу с такими моделями можно проводить на обычном смартфоне или ноутбуке, и для этого не потребуется использовать мощные серверы с GPU. Новый метод позволит тестировать и внедрять новые решения на основе нейросетей, экономя как время, так и деньги на разработку.

Также этот метод позволит сделать работы с нейросетями доступными для небольших компаний, лабораторий и индивидуальных разработчиков. Если раньше перед запуском на смартфоне или ноутбуке необходимо было делать так называемую квантизацию на мощном сервере, что требовало продолжительного времени и затрат, то теперь эта задача может быть реализована с помощью смартфона или ноутбука за короткое время.

Новый метод проверили на большой языковой модели Llama 3 и Qwen 2.5, и он показал свою эффективность. Ранее ИА «Бизнес Код» писало, что Яндекс обновил веб музыку.

Экспертное мнение

"Осуществляется системная работа по совершенствованию законодательных норм, регулирующих сбор, передачу, обработку и хранение персональных данных, внедряются передовые методы обеспечения кибербезопасности"

Лента

Яндекс улучшил нейросетевое сжатие

Мельникова стала трехкратной чемпионкой мира

Взрыв межконтинентальной ракеты Р-16 в Байконуре: прошло 65 лет

Президент США Дональд Трамп рассматривает возможность военного вмешательства в Венесуэлу

Как в Ленинградской области взлетел первый в России самолёт

ЕС запретил транзакции с пятью российскими банками