047. Как запустить LLM (generative AI) на AWS - podcast episode cover

047. Как запустить LLM (generative AI) на AWS

May 10, 202431 minSeason 4Ep. 47
--:--
--:--
Download Metacast podcast app
Listen to this episode in Metacast mobile app
Don't just listen to podcasts. Learn from them with transcripts, summaries, and chapters for every episode. Skim, search, and bookmark insights. Learn more

Episode description

Хотите понять, как работать с большими языковыми моделями в облаке AWS? В этом выпуске мы пригласили Рустема (Rustem Feyzkhanov) - специалиста по машинному обучению и AWS Hero. Мы подробно разобрали разные варианты деплоя LLM:   •Amazon Bedrock - сервис для быстрого запуска популярных моделей •Amazon SageMaker JumpStart - кастомные модели в пару кликов •Hugging Face Estimator - доступ к библиотеке моделей Hugging Face •Развертывание в контейнерах ECS и на GPU-инстансах EC2 •AWS Lambda - какие особенности надо учесть при таком запуске   С чего начать, что выбрать под свой кейс, как оптимизировать затраты - ответы в подкасте.   Слушайте, пробуйте!   Ссылки упомянутые во время подкаста:  
For the best experience, listen in Metacast app for iOS or Android