Аудитория Алисы AI — более 30 миллионов активных пользователей в месяц. Для работы множества фич (от сложных LLM-агентов до генерации видео) мы задействуем гигантский парк GPU. В условиях мирового дефицита железа эффективность этого кластера — наш стратегический приоритет. Ищем технического менеджера, которому предстоит решить нетривиальную задачу: построить целостную модель потребления GPU и выстроить прозрачный процесс capacity-планирования.
Обязанности
Аналитика и юнит-экономика
Вам предстоит связать метрики утилизации с экономикой: считать стоимость запроса и генерации, анализировать паттерны потребления и разрабатывать ROI-дашборды для топ-менеджмента. Для работы с сырыми данными, проверки гипотез и поиска узких мест нужно будет самостоятельно писать скрипты (Python, SQL). Приветствуется использование AI-ассистентов для решения задач.
• Capacity planning и автоматизация
Вы будете строить предиктивные модели потребности в GPU с учётом органического роста трафика и запуска новых фич, а также автоматизировать процессы финансового прогнозирования, чтобы полностью уйти от ручного распределения квот.
Координация и архитектура
Нужно будет выстроить прозрачный процесс приоритизации выдачи карт совместно с командой инфраструктуры Яндекса. Вы будете консультировать продуктовые команды по выбору оптимальных платформ и моделей видеокарт, управлять кросс-командными проектами оптимизации.
Требования
Работали с большими объёмами данных: знаете SQL (обязательно), владеете Python (желательно)
• Выстраивали процессы: например, занимались рефакторингом кода или запускали бизнес-процессы
• Умеете находить паттерны и строить модели
• Ориентированы на результат: не ждёте инструкций, а находите проблемы и решаете их
Условия
Наше ДМС поможет предотвратить болезни: в него входят регулярные чекапы и вакцинация.