Микросервисы и системная архитектура для Applied AI
Представьте, что микросервисы - это модульные космические корабли, а Docker - ваш личный космодром для их сборки. Здесь вы научитесь проектировать "орбитальные станции" для AI Агентов: разбивать монолитные системы на автономные сервисы-спутники, настраивать их взаимодействие через межзвёздные протоколы (REST/gRPC) и автоматизировать развёртывание с помощью CI/CD-ракетоносителей. Эти навыки позволят вашим нейросетям масштабироваться как галактическая империя, обновляться без простоев и переживать сбои отдельных компонентов без коллапса всей системы.
Инструкция к Ask AI
Так как данные темы не меняются со временем, лучше всего вам изучать их с персональным преподавателем - ChatGPT.
Процесс изучения должен быть следующим:
- вы составляете системный промпт для ChatGPT (шаблоны), где описываете свой бэкграунд, предпочтения, уровень подробности объяснений и т.д.
- копируете тему из списка (тройной клик), и просите ChatGPT объяснить вам эту тему
- при желании углубиться, задаете уточняющие вопросы
На данный момент это самый удобный способ изучения основ. Кроме концептов, вы можете изучать дополнительные материалы в секциях Gold, Silver, Extra.
- Gold - стоит обязательно изучить до общения с ChatGPT
- Ask AI - задавайте вопросы по каждой малознакомой теме
- Silver - второстепенные материалы
- Extra - углубленные темы
Golden
1. Videos
Merion
Kuber
CICD
микросервисы
gh actions
sys des: docker
2. Архитектуры для GenAI
Стандартная архитектура для AI Агента
- прокси к LLM нам нужна для соблюдения rate-limiting
- прокси к внешнему API нам нужна для соблюдения rate-limiting и кэширования результатов
- гейтвей перед бэкендом нам нужен для классификации запросов, определения ролей пользователя (paid tier, free tier), установки ограничений на размер контекста и др., установка rate-limiting и др.
Ask AI
-
Основные концепции микросервисной архитектуры (Стартовый гайд)
-
Микросервисы vs Монолит: полное сравнение архитектур
-
Domain-Driven Design: базовые принципы для микросервисов
-
API Gateway: паттерны для начинающих (Обзорно)
-
Docker для AI-сервисов: минимально необходимые практики
-
Kubernetes: основы оркестрации для AI-разработчиков
-
Балансировка нагрузки GPU-задач: базовые подходы
-
Версионирование AI-моделей: семантическое версионирование
-
A/B тестирование моделей: production-кейсы (Краткий обзор)
-
Безопасность AI-сервисов: OAuth2/JWT на практике
-
Rate limiting для AI-операций: основы для начинающих
-
CI/CD для AI: минимальный рабочий пайплайн
-
GRPC vs REST: сравнение для AI API (Концепт)
-
Кэширование результатов ML-моделей: базовые стратегии
-
Circuit Breaker: принцип работы и реализация
-
Мониторинг нейросетевых сервисов: ключевые метрики
-
Кэширование: TTL vs инвалидация (Сравнительный анализ)
Кэширование: стратегии и инвалидация кэша
-
Message Queue: базовые концепции и use-cases (Обзорно)