Аналитическая система
Контент-аналитика маркетплейса
Система A/B-тестирования и отчётности для маркетплейса с миллионами SKU
Задача
Миллионы SKU — и никто не знал, что работает
Команда маркетплейса обновляла карточки товаров вслепую: меняли фото, тексты, цены — и не могли достоверно измерить эффект. Отчёты готовились вручную в Excel, данные устаревали на 2–3 дня, A/B-тесты не масштабировались.
- Аналитические отчёты готовились 2–3 дня вручную в Excel
- A/B-тесты для контента велись через внешние инструменты без интеграции с продуктом
- Невозможно было сравнить эффективность изменений на уровне категории или бренда
- Данные теряли актуальность — решения принимались по «ощущениям»
- Нет единой метрики качества контента по всему каталогу
Решение
Data pipeline + A/B платформа на Airflow и ClickHouse
Построили аналитический стек с нуля: инфраструктуру сбора данных на Apache Airflow, OLAP-хранилище в ClickHouse, A/B-фреймворк для контентных тестов и интерактивные дашборды в Superset.
Ежедневная обработка 5M+ SKU: обогащение, нормализация, расчёт метрик качества контента. Мониторинг через Grafana.
Аналитические запросы по всему каталогу за секунды. Партиционирование по дате и категории, материализованные представления.
Статистически корректное сравнение вариантов контента: p-value, MDE, размер выборки. Автоматическая остановка при достижении значимости.
Self-service аналитика для product-менеджеров без SQL: срезы по категориям, брендам, типам контента.
Технологии
Стек проекта
- Apache Airflow 2.7
- Python 3.11
- Pandas
- dbt
- ClickHouse 23
- PostgreSQL
- S3 (Yandex Object Storage)
- Apache Superset
- Statsmodels
- SciPy (A/B stats)
- Kubernetes
- Grafana
- Prometheus
- GitHub Actions
Результат
Что получилось
Похожая задача?
Разберём вашу задачу и предложим решение. Без продажных звонков.