ИИ-вычисления на CPU, ПАК под инференс на периферии сети и архитектура со стойками на 20 кВт — какое будущее ждёт облако Билайна?Сегодня Билайн, как и другие, предоставляет в аренду инфраструктуру с GPU. Такая модель работает, но имеет очевидное ограничение: высокий порог входа — от настройки пайплайнов до выбора моделей.Исправить это собираются с помощью внутреннего инструмента платформы. Для своих задач Билайн уже использует облако с возможностью выделения тенанта с RAG-стеком, в котором есть векторная база, пайплайны обработки и централизованный доступ к моделям. В ближайшие месяцы его запустят в закрытый тест среди текущих клиентов, а затем откроют доступ более широкому кругу компаний. Этим ИИ-активность Билайна не ограничивается. Компания в том числе проводит эксперименты с применением моделей на CPU. Пока особо ярких результатов нет, но направление не сбрасывают со счетов. Опыты планируют продолжить с NPU, ASIC и другими (а в перспективе руки инженеров могут дойти и до нейроморфных процессоров, но здесь пока без конкретики).Параллельно компания ведёт разработку программно-аппаратного комплекса под инференс, который можно было бы использовать на периферии сети. Билайн развивает собственный CDN и заинтересован в минимизации задержек при доставке ИИ-сервисов. Идея — разместить вычисления максимально близко к пользователю, особенно в задачах, чувствительных к отклику.В этом контексте Билайн также ведёт переговоры с производителем серверного оборудования OpenYard, чтобы совместно протестировать и интегрировать решения на базе их платформы. В части организации ЦОДов под облако в Билайне выработали устойчивую модель масштабирования, которая включает типовые compute и storage решения, размещённые коридорами, адаптированными под инженерную инфраструктуру. Основная конфигурация — это стойки по 7 кВт, оптимально сбалансированные для стандартных холодных/тёплых зон.Что касается GPU-нагрузок, то для них также тестируются и формируются типовые конфигурации, которые можно масштабировать без необходимости в строительстве дорогих специализированных зон. Пока в Билайне не видят краткосрочного спроса, оправдывающего запуск ЦОД под стойки 35 кВт. Вероятно, этот вопрос станет актуальнее к началу 2026 года. Но зато говорят, что уже подобрали рабочую архитектуру со стойками на 20 кВт, которые можно размещать на текущих площадках. В компании говорят, что могут гибко комбинировать модули с разной нагрузкой — как под классические облачные задачи, так и под перспективные сценарии с высокой плотностью (включая GPU) — даже в рамках собственного дата-центра в Ярославле. Общая территория площадки — порядка 7 гектаров, и не менее половины из них остаются доступны для строительства следующих модулей. Побывал там на прошлой неделе и был приятно впечатлён. Организовано монументально, но масштабироваться как по мощностям, так и по энергетике, явно есть куда.Что же касается отечественного «железа». В Билайне напомнили, что они не просто поставщик облачных услуг, но и сами эксплуатируют ЗОКИИ. У компании есть облачный сегмент, полностью построенный на ру-оборудовании с необходимыми сертификациями. Но стоимость таких решений всё ещё выше на десятки процентов.Поэтому в компании видят свою задачу в поиске оптимальных конфигураций и снижении TCO (total cost of ownership), чтобы такие решения могли конкурировать по цене. Заявляется, что Билайн уже ведёт работу с рядом российских производителей в этом направлении.Доля отечественного оборудования на рынке серверов, тем временем, продолжает расти. По данным свежего исследования Fplus, в 2024 году на российскую технику пришлось 100–110 млрд рублей из общего объёма в 151 млрд рублей. В штуках было закуплено 130-150 тысяч серверов, а в топ-5 вендоров входят Yadro, «Аквариус», Depo Computers, Kraftway и Fplus.Но, как пишут сами авторы исследования, основными заказчиками ру-серверов выступают компании, обладающие крупной критической инфраструктурой. прим. ред.