Дипломная работа на тему "ТЮМГУ | Разработка специализированного поискового сервиса персональных данных в открытых источниках"
Диплом по теме «Разработка специализированного поискового сервиса персональных данных в открытых источниках» включает анализ угроз цифровой идентичности, проектирование архитектуры сбора и индексации данных, реализацию поискового движка с фильтрацией по юрисдикции и уровню чувствительности. Работа соответствует требованиям Синергия по специальности 09.03.02 и включает расчёт экономического ущерба от утечек.
Нужен разбор вашей темы Дипломная работа на тему "ТЮМГУ | Разработка специализированного поискового сервиса персональных данных в открытых источниках"? Получите бесплатную консультацию: @Diplomit | +7 (987) 915-99-32 (WhatsApp)
Актуальность темы
В 2024 году в России зафиксировано 12,7 млн утечек персональных данных — рост на 34% по сравнению с 2022 годом (источник: ФСТЭК России). При этом 68% информации попадает в открытые источники: соцсети, форумы, GitHub, публичные базы. ТЮМГУ, как федеральный университет, сталкивается с рисками компрометации сотрудников и студентов через досье, собираемые с помощью OSINT-инструментов.
По нашему опыту анализа 50+ работ по Прикладная информатика в Синергия, тема поисковых сервисов персональных данных остаётся недооценённой. Большинство студентов ограничиваются теорией, но не реализуют реально работающий прототип. А ведь уже в 2025 году Роскомнадзор ввёл штрафы до 2 млн руб. за незаконный сбор ПДн (постановление № 102 от 14.03.2025).
Ключевая проблема: отсутствие специализированных поисковиков, ориентированных на российские источники и требования ФЗ-152. Общие платформы вроде Google или Yandex не фильтруют по чувствительности или юрисдикции. Это создаёт пробел, который и может закрыть ваша ВКР.
Цель и задачи
Цель: разработка поискового сервиса для обнаружения персональных данных в открытых источниках с учётом требований ФЗ-152 и ГОСТ Р 57580.1-2017.
Задачи:
- Проанализировать угрозы утечки ПДн в российских вузах (на примере ТЮМГУ).
- Изучить существующие OSINT-инструменты: Maltego, SpiderFoot, theHarvester.
- Разработать архитектуру сбора данных с учётом rate-limiting и CAPTCHA. <4>Спроектировать базу данных с классификацией данных по уровню чувствительности (ФСТЭК).
- Реализовать поисковый интерфейс с фильтрацией по источнику, дате, типу данных.
- Оценить экономическую эффективность внедрения (снижение рисков компрометации).
Задачи соответствуют структуре методички Синергия: анализ → проектирование → разработка → расчёт. Особенно важно привязать фильтрацию к классификатору ФСТЭК — это повысит научную ценность.
Рекомендуемая структура дипломной работы
| Раздел ВКР | Рекомендуемый объем |
|---|---|
| Введение | 3–5 страниц |
| Теоретическая глава | 25–30 страниц |
| Аналитическая часть | 30–40 страниц |
| Практическая часть | 30–40 страниц |
| Экономическая эффективность | 20–25 страниц |
Пример введения для Синергия
В условиях цифровизации образовательной среды Тюменского государственного университета возрастает риск утечки персональных данных студентов и сотрудников через открытые источники. Ежедневно в интернете публикуются десятки тысяч фрагментов ПДн: от сканов документов до постов в соцсетях. Существующие поисковые системы не обеспечивают фильтрацию по чувствительности или юрисдикции, что затрудняет мониторинг угроз.
Объект исследования — информационная безопасность ТЮМГУ. Предмет — процессы обнаружения и классификации персональных данных в открытых источниках. Цель работы — разработка специализированного поискового сервиса, позволяющего выявлять утечки ПДн с учётом требований ФЗ-152 и ГОСТ Р 57580.1-2017.
Научная новизна заключается в адаптации классификатора чувствительности ФСТЭК для автоматизированной фильтрации. Практическая значимость — снижение рисков штрафов и репутационных потерь для вуза. Работа опирается на ГОСТ 34.602-2020 (информационные системы) и методические рекомендации Синергия по оформлению ВКР.
Как написать заключение по Прикладная информатика
В ходе работы был проанализирован уровень угроз персональным данным в российских вузах, разработана архитектура поискового сервиса с модулями сбора, индексации и фильтрации. Реализован прототип на Python с использованием Scrapy, Elasticsearch и Flask. Система позволяет обнаруживать утечки ПДн с точностью 89% и классифицировать их по уровню чувствительности.
Расчёт показал, что внедрение сервиса в ТЮМГУ сократит риски штрафов на 40%, а время реагирования на утечки — с 72 до 6 часов. Рекомендуется интеграция с системой SIEM университета и регулярное обновление списка источников.
Требования к списку литературы Синергия
Список должен содержать не менее 20 источников, из них 10% — за последние 2 года. Обязательно включение:
- ФЗ-152 «О персональных данных»
- ГОСТ Р 7.0.100-2018 (библиографическая запись)
- ГОСТ Р 57580.1-2017 (защита ПДн)
Примеры реальных источников:
- ФСТЭК России. Нормативные документы по защите ПДн (2024)
- Роскомнадзор. Правовые основы обработки персональных данных (2025)
⚠️ Типичные ошибки при написании Дипломная работа на тему "ТЮМГУ | Разработка специализированного поискового сервиса персональных данных в открытых источниках"
- Ошибка: Использование общих поисковых движков без адаптации → Как проверить: Убедитесь, что ваш сервис фильтрует по типу данных (паспорт, ИНН, телефон).
- Ошибка: Отсутствие расчёта экономического эффекта → Решение: Используйте методику сравнения с базовым вариантом (ручной мониторинг).
- Ошибка: Нарушение авторских прав при сборе данных → Чек-лист: Добавьте robots.txt-парсер и задержки между запросами.
Частые вопросы по теме «Дипломная работа на тему "ТЮМГУ | Разработка специализированного поискового сервиса персональных данных в открытых источниках"»
- В: Сколько страниц должна быть практическая часть? О: В Синергия — 40–60 стр. с кодом, схемами и результатами тестирования.
- В: Нужен ли реальный код в приложении? О: Да, фрагменты ключевых модулей (сбор, индексация, поиск) обязательны.
- В: Можно ли использовать open-source решения? О: Да, но с доработкой под российские источники и требования ФЗ-152.
- В: Как проверить уникальность перед сдачей? О: Используйте Антиплагиат.ВУЗ с настройками Синергия (порог 75%).
Вопросы, которые часто задают студенты
Можно ли использовать готовые решения в ВКР?
Да, но с адаптацией. Например, SpiderFoot можно взять за основу, но добавить модуль классификации по ГОСТ Р 57580.1-2017. Главное — показать вклад: новые алгоритмы, интерфейс, интеграцию с российскими источниками.
Сколько страниц должна быть практическая часть?
40–60 страниц. Включите: диаграммы UML, ER-модель, листинг кода (300–400 строк), скриншоты интерфейса, результаты тестирования. Без этого комиссия может запросить доработку.
Можно ли использовать open-source решения?
Да, но только с указанием источника и модификацией. Например, Elasticsearch — отличный движок, но нужно реализовать кастомный анализатор для русского языка и чувствительных данных.
✅ Чек-лист перед защитой Дипломная работа на тему "ТЮМГУ | Разработка специализированного поискового сервиса персональных данных в открытых источниках"
- □ Все задачи из введения выполнены и отражены в заключении
- □ Структура соотвествует требованиям методички Синергия
- □ Уникальность >75% по Антиплагиат.ВУЗ (настройки вуза)
- □ Источники оформлены по ГОСТ Р 7.0.100-2018
- □ Работа содержит реальные данные, а не шаблоны
- □ Код протестирован и приложен в приложении
Застряли на этапе реализации поискового движка? Наши эксперты по Прикладная информатика помогут разобраться. Написать в Telegram или +7 (987) 915-99-32 (WhatsApp)
⭐ MAКСНужна помощь с вашей работой?























