Диплом «Разработка компонентов проекта создания хранилища данных для АО «ФармаПлюс»»
Бесплатная консультация по вашей теме: Telegram: @Diplomit, WhatsApp/Тел.: +7 (987) 915-99-32, Email: admin@diplom-it.ru
Актуальность темы
Данные продаж аптеки «ФармаПлюс» хранятся в «1С:Розница», e-commerce-платформе и CRM, что усложняет анализ оборачиваемости и мониторинг дефицитов. Единое DWH в Snowflake позволит сократить время подготовки отчёта по топ-SKU с 6 часов до 20 минут.
Бесплатная консультация по вашей теме: Telegram: @Diplomit, WhatsApp: +7 (987) 915-99-32, Тел.: +7 (987) 915-99-32, Email: admin@diplom-it.ru, MAX: +7 (987) 915-99-32
Смотрите подробное руководство по написанию ВКР.Цель и задачи
Цель: реализовать компоненты DWH, обеспечивающие единую витрину продаж и запасов, точность данных 99 % и SLA выгрузок <15 минут.
Задачи:
- Разработать концептуальную модель «звезда»;
- Настроить CDC из «1С» и Magento через Debezium;
- Создать DAG-и ETL в Apache Airflow;
- Оптимизировать кластеры Snowflake (multi-cluster warehouse);
- Подготовить витрину для Power BI.
Объект и предмет
Объект — данные продаж и запасов сети «ФармаПлюс».
Предмет — компоненты ETL/ELT, модель хранилища и витрины аналитики.
Примерный план
- Введение
- Теоретические основы DWH (Kimball vs Data Vault)
- Анализ источников и требований
- Проектирование моделей и датамартов
- Разработка ETL и CI/CD
- Оценка производительности и затрат
- Заключение
- Список источников
Трудности с Airflow? Telegram: @Diplomit
Ожидаемые результаты
- ER-диаграмма «звезда» — 1 факт, 7 измерений;
- 25 DAG-ов Airflow (Python);
- Скорость загрузки 10 млн строк/час;
- Экономия 14 млн ₽ на снижение списаний.
Пример введения
Рынок фарм-ритейла характеризуется высокой волатильностью спроса и жёстким регуляторным контролем. Для оперативных решений требуются консистентные данные в единой точке. Хранилище данных становится ядром, объединяющим продажи, маркетинг и остатки.
Заключение
Разработанные компоненты DWH подтвердили SLA <15 мин. и точность 99,3 %. Инвестиции окупаются за 1,5 года за счёт сокращения out-of-stock и списаний.
Требования к списку источников
• 35+ источников, 40 % — 2023-2025 гг.
Пример:
1. Kimball R. The Data Warehouse Toolkit. — 4-е изд., 2024.
2. Snowflake. Performance Best Practices. — 2025.
3. Apache Airflow Docs 2.9. — 2025.
Полезные материалы для написания
Нужна помощь с ВКР?
Мы разработаем архитектуру DWH, ETL-процессы и расчёты окупаемости.