047. Как запустить LLM (generative AI) на AWS - podcast episode cover

047. Как запустить LLM (generative AI) на AWS

May 10, 202431 minSeason 3Ep. 47
--:--
--:--
Listen in podcast apps:

Episode description

Хотите понять, как работать с большими языковыми моделями в облаке AWS? В этом выпуске мы пригласили Рустема (Rustem Feyzkhanov) - специалиста по машинному обучению и AWS Hero. Мы подробно разобрали разные варианты деплоя LLM:   •Amazon Bedrock - сервис для быстрого запуска популярных моделей •Amazon SageMaker JumpStart - кастомные модели в пару кликов •Hugging Face Estimator - доступ к библиотеке моделей Hugging Face •Развертывание в контейнерах ECS и на GPU-инстансах EC2 •AWS Lambda - какие особенности надо учесть при таком запуске   С чего начать, что выбрать под свой кейс, как оптимизировать затраты - ответы в подкасте.   Слушайте, пробуйте!   Ссылки упомянутые во время подкаста:  
047. Как запустить LLM (generative AI) на AWS | AWS на русском podcast - Listen or read transcript on Metacast