Диплом (ВКР) по теме «Разработка и программная реализация алгоритма отслеживания действий персонажей книг»
Работа по теме «Разработка и программная реализация алгоритма отслеживания действий персонажей книг» включает анализ текстов, извлечение сущностей, построение временных графов поведения и визуализацию. В ВШЭ по специальности 09.03.02 Прикладная информатика требуется строгое соответствие ГОСТ 34.602-2020 и Р 7.0.100-2018. В статье — структура, примеры кода, типичные ошибки и чек-лист перед защитой.
Нужен разбор вашей темы Разработка и программная реализация алгоритма отслеживания действий персонажей книг? Получите бесплатную консультацию: @Diplomit | +7 (987) 915-99-32 (WhatsApp)
Актуальность темы
Книги — не просто текст. Это сложные сети взаимодействий, где персонажи действуют, меняются, конфликтуют. В университетах, включая ВШЭ, растёт интерес к цифровым гуманитарным наукам. По данным eLibrary (2025), число публикаций по NLP в литературе выросло на 63% за 3 года.
На практике: издательства, платформы вроде ЛитРес и образовательные проекты нуждаются в автоматизированном анализе сюжетов. Ручной разбор — это 20–30 часов на роман. Автоматизация сокращает до 15 минут. При этом точность распознавания сущностей достигает 89% при использовании spaCy + кастомных правил (источник: CyberLeninka, 2024).
Зачем это в Прикладной информатике? Потому что вы не просто пишете код. Вы проектируете систему, которая решает реальную задачу — структурирование хаотичного текста. Это пересекается с задачами анализа соцсетей, мониторинга отзывов, автоматизации контент-анализа.
Цель и задачи
Цель: разработать и реализовать алгоритм отслеживания действий персонажей в художественных текстах с визуализацией их поведения во времени.
Задачи исследования:
- Проанализировать методы извлечения сущностей (NER) и связывания именованных сущностей (EL) в русскоязычных текстах.
- Выбрать и адаптировать модель для распознавания персонажей и их действий (глаголов в контексте).
- Разработать алгоритм сопоставления действий с персонажами с учётом падежей и местоимений.
- Построить временную шкалу событий (timeline) для каждого персонажа. <5>Создать визуализацию взаимодействий персонажей в виде графа.
- Реализовать прототип на Python с использованием spaCy, NetworkX и Streamlit.
- Оценить точность алгоритма на тестовых отрывках из «Войны и мира» и «Преступления и наказания».
- Обосновать экономическую эффективность внедрения в образовательной среде.
Задачи соответствуют структуре методички ВШЭ: анализ → проектирование → разработка → оценка.
Объект и предмет исследования
- Объект: процесс анализа художественного текста в образовательной организации (например, кафедра литературы ВШЭ).
- Предмет: алгоритм отслеживания действий персонажей и его программная реализация.
Ожидаемые результаты и практическая значимость
После реализации система должна:
- автоматически выделять персонажей и их действия с точностью ≥85%;
- строить граф взаимодействий (кто с кем взаимодействует, сколько раз);
- формировать временную ленту действий по главам;
- экспортировать данные в JSON и GEXF (для Gephi).
Практическая польза: преподаватели смогут за 5 минут получить структурированный анализ романа. Студенты — использовать визуализации для подготовки к семинарам. Экономия времени — до 70% на подготовку одного разбора.
Рекомендуемая структура дипломной работы
| Раздел ВКР | Рекомендуемый объем |
|---|---|
| Введение | 3–5 страниц |
| Теоретическая глава | 25–30 страниц |
| Аналитическая часть | 30–40 страниц |
| Практическая часть | 30–40 страниц |
| Экономическая эффективность | 20–25 страниц |
| Заключение | 3–5 страниц |
Пример введения для ВШЭ
Современные методы обработки естественного языка позволяют автоматизировать анализ художественных текстов, что особенно актуально для образовательных и издательских организаций. В рамках данной работы решается задача отслеживания действий персонажей в литературных произведениях с целью визуализации их поведения и взаимодействий. Объектом исследования выступает процесс анализа художественного текста на кафедре литературы, предметом — алгоритм отслеживания действий персонажей.
Целью работы является разработка и программная реализация алгоритма, способного извлекать действия персонажей, сопоставлять их во времени и визуализировать. Задачи включают анализ существующих решений, проектирование архитектуры системы, реализацию прототипа и оценку его эффективности. В качестве методов используются анализ, синтез, моделирование и эксперимент.
Информационная база включает научные публикации по NLP, документацию spaCy, ГОСТ 34.602-2020 и методические указания ВШЭ. Работа состоит из трёх глав, 67 страниц, 12 рисунков, 8 таблиц, 3 приложений и 34 источников.
Как написать заключение по Прикладная информатика
В ходе исследования была разработана система автоматического отслеживания действий персонажей в художественных текстах. Реализован прототип на Python с использованием spaCy для NER и кастомных правил для разрешения местоимений. Система демонстрирует точность распознавания персонажей 91% и действий — 86% на тестовых данных.
Практическая значимость подтверждена расчётом экономического эффекта: внедрение в образовательной среде сокращает время подготовки анализа романа с 25 до 3 часов. Это повышает эффективность преподавания и вовлечённость студентов.
Рекомендуется дальнейшее развитие системы с добавлением анализа эмоциональной окраски действий и интеграцией с LMS (например, Moodle). Работа полностью соответствует целям и задачам, поставленным во введении.
Требования к списку литературы ВШЭ
Список оформляется по ГОСТ Р 7.0.100-2018. Обязательны: законодательные акты, научная литература, методические материалы, не менее 10% источников — за 2024–2026 гг.
Примеры проверенных источников:
- ГОСТ Р 7.0.100-2018. Система стандартов по информации, библиотечному и издательскому делу. https://docs.cntd.ru/document/1200158144
- Honnibal M., Montani I. spaCy: Industrial-Strength Natural Language Processing in Python. 2017. https://doi.org/10.5281/zenodo.1212303
- Кораблёв А.А. Анализ текстов на естественном языке для литературных исследований. // Вестник НГУ. 2024. Т. 19, № 2. С. 45–58. https://cyberleninka.ru/article/n/analiz-tekstov-na-estestvennom-yazyke-dlya-literaturnyh-issledovaniy
⚠️ Типичные ошибки при написании Разработка и программная реализация алгоритма отслеживания действий персонажей книг
- Ошибка: Использование общих фраз в актуальности без ссылок на данные → Решение: Вставляйте статистику из eLibrary, Росстата, отраслевых отчётов.
- Ошибка: Отсутствие реальных тестовых данных → Как проверить: Убедитесь, что в приложении есть фрагменты из «Войны и мира» или «Мастера и Маргариты» с разметкой.
- Ошибка: Несоответствие задач цели → Чек-лист: Каждая задача должна начинаться с глагола и вести к результату из цели.
- Ошибка: Код без комментариев и пояснений → Решение: Добавьте блок-комментарии и описание логики в текст главы.
Частые вопросы по теме «Разработка и программная реализация алгоритма отслеживания действий персонажей книг»
- В: Сколько страниц должна быть практическая часть? О: В ВШЭ — 30–40 стр. с диаграммами, кодом, скриншотами интерфейса. Смотрите методичку вашего факультета.
- В: Нужен ли реальный код в приложении? О: Да. Обязательны фрагменты ключевых модулей: NER, разрешение местоимений, построение графа. Объём — до 400 операторов.
- В: Как проверить уникальность перед сдачей? О: Используйте Антиплагиат.ВУЗ с настройками ВШЭ. Минимум — 75%. Избегайте копирования описаний библиотек.
- В: Можно ли использовать spaCy? О: Да, но с адаптацией под русский язык и кастомными правилами. Чистое использование out-of-the-box снижает оригинальность.
- В: Нужно ли патентовать алгоритм? О: Нет. Для ВКР достаточно описания и реализации. Патент — отдельный процесс.
Вопросы, которые часто задают студенты
Можно ли использовать готовые решения в ВКР?
Да, но с адаптацией. Например, spaCy — отличная база, но нужно добавить свои правила для русского языка: обработку падежей, кличек, местоимений. Чистое копирование снижает уникальность и вызывает вопросы на защите. По опыту — лучшие работы комбинируют open-source и авторские наработки.
Сколько страниц должна быть практическая часть?
Рекомендуемый объём — 30–40 страниц. Включайте: схему архитектуры, ER-модель (если есть БД), дерево функций, блок-схемы алгоритмов, фрагменты кода, скриншоты интерфейса, результаты тестирования. Всё должно быть связано с задачами из введения.
Можно ли использовать open-source решения?
Можно и нужно. Библиотеки вроде spaCy, NLTK, NetworkX — стандарт в NLP. Главное — не просто подключить, а адаптировать. Например, обучить NER на корпусе художественных текстов. Это покажет вашу экспертизу и соответствие требованиям ВШЭ к научной новизне.
✅ Чек-лист перед защитой Разработка и программная реализация алгоритма отслеживания действий персонажей книг
- □ Все задачи из введения выполнены и отражены в заключении
- □ Структура соответствует требованиям методички ВШЭ
- □ Уникальность >75% по Антиплагиат.ВУЗ (настройки вуза)
- □ Источники оформлены по ГОСТ Р 7.0.100-2018
- □ Работа содержит реальные данные, а не шаблоны
- □ Код в приложении — рабочий, с комментариями
- □ Есть скриншоты интерфейса и результатов обработки
- □ Экономический расчёт обоснован и реалистичен
Застряли на этапе реализации алгоритма? Наши эксперты по Прикладная информатика помогут разобраться. Написать в Telegram или +7 (987) 915-99-32 (WhatsApp)
⭐ MAКСПроверьте свою тему ВКР
- □ Есть ли реальная организация для анализа?
- □ Есть ли измеримый эффект внедрения?
- □ Можно ли построить диаграммы процессов?
- □ Есть ли реальные данные для экономических расчетов?
Нужна помощь с вашей работой?























