Диплом «Проект создания хранилища данных для сети супермаркетов «ФрешМаркет»»
Бесплатная консультация по вашей теме: Telegram: @Diplomit Телефон/WhatsApp/MAX: +7 (987) 915-99-32, Email: admin@diplom-it.ru
Актуальность темы
«ФрешМаркет» управляет 180 магазинами и 12 центральными складами. Данные о продажах, запасах и программе лояльности хранятся в разрозненных системах, что затрудняет анализ оборачиваемости. DWH на Snowflake обеспечит единый источник данных.
Бесплатная консультация по вашей теме: Telegram: @Diplomit WhatsApp: +7 (987) 915-99-32 | Телефон: +7 (987) 915-99-32, Email: admin@diplom-it.ru | MAX: +7 (987) 915-99-32
Методика написания приведена в руководстве.Цель и задачи
Цель: создать DWH, сокращающий время подготовки отчёта о продажах с 8 часов до 30 минут и повышающий точность прогноза спроса на 12 %.
Задачи:
- Собрать бизнес-требования BI;
- Спроектировать модель «звезда» для фактов продаж и запасов;
- Разработать ETL на Apache Airflow;
- Настроить CDC из «1С:Розница»;
- Оценить TCO и ROI.
Объект и предмет
Объект — корпоративные данные «ФрешМаркет».
Предмет — архитектура хранилища и процессы загрузки/очистки.
Примерный план
- Введение
- Методологии Kimball vs Data Vault
- Анализ источников данных
- Проектирование модели DWH
- Разработка ETL-процессов
- Экономическая оценка
- Заключение
- Список источников
Нужна помощь с Airflow DAG? Telegram: @Diplomit
Ожидаемые результаты
- ER-диаграмма «звезда» 1 факт, 6 измерений;
- 20 DAG-ов Airflow;
- Скорость построения отчёта — 30 мин;
- ROI проекта — 146 % за 2 года.
Пример введения
Быстрый доступ к данным о продажах позволяет сетям розницы оперативно управлять ассортиментом и снижать списания. Разрозненные системы порождают «зонтичные» отчёты. Предлагаемый DWH-проект объединит данные и ускорит принятие решений.
Заключение
DWH-проект готов к внедрению: проведены нагрузочные тесты (10 млн строк/час), рассчитан TCO, подготовлены политики хранения. Экономия на списаниях — 37 млн ₽ в год.
Требования к списку источников
• 38 источников, 40 % — 2024-2025 гг.;
• ГОСТ 7.0.5-2021.
Пример:
1. Kimball R. The Data Warehouse Toolkit. — 4-е изд., 2024.
2. Snowflake. Best Practices White Paper. — 2023.
3. Apache Airflow 2.9 Docs. — 2025.