Написать диплом по теме «Разработка системы автоматического реферирования научных статей с использованием метода извлечения ключевых предложений»
Разработка системы автоматического реферирования — это задача на стыке NLP, анализа текста и проектирования ИС. В работе по специальности 09.03.02 МТИ нужно показать анализ существующих решений, выбрать метод извлечения ключевых предложений (например, TextRank или BERT), реализовать прототип и оценить его точность. Код, схемы и экономический расчёт должны соответствовать ГОСТ 34.602-2020 и методичке вуза.
Нужен разбор вашей темы Разработка системы автоматического реферирования научных статей с использованием метода извлечения ключевых предложений? Получите бесплатную консультацию: @Diplomit | +7 (987) 915-99-32 (WhatsApp)
Актуальность темы
Каждый год в мире публикуется более 3 миллионов научных статей (по данным Scimago Journal & Country Rank, 2024). Средний исследователь тратит до 20 часов в неделю на чтение и анализ литературы. Автоматическое реферирование — не просто удобство, а необходимость для ускорения научного процесса.
В российских вузах, включая МТИ, студенты и преподаватели сталкиваются с перегрузкой информацией. Система, способная за 30 секунд выдавать краткое содержание статьи, сокращает время анализа на 60–70%. Особенно актуально для специальности 09.03.02, где требуется глубокая проработка аналитической главы.
Заметьте: не нужно изобретать велосипед. Современные методы извлечения ключевых предложений — TextRank, BERT, SummaC — уже протестированы. Задача студента — адаптировать один из них под русскоязычные научные тексты, что и делает тему актуальной и выполнимой.
Цель и задачи
Цель: разработка программного модуля, автоматически генерирующего краткие рефераты научных статей на русском языке с использованием метода извлечения ключевых предложений.
Задачи:
- Проанализировать существующие системы реферирования (SMMRY, Scholarcy, Resoomer).
- Изучить алгоритмы извлечения ключевых предложений (TextRank, BERT, TF-IDF).
- Выбрать и обосновать стек технологий (Python, spaCy, Transformers). <4>Разработать прототип системы с интерфейсом загрузки PDF и вывода реферата.
- Провести оценку качества рефератов по метрикам ROUGE и BLEU.
- Рассчитать экономическую эффективность внедрения в научную библиотеку МТИ.
Задачи соответствуют структуре методички МТИ: анализ → проектирование → реализация → экономика. Каждая задача — шаг к достижению цели, а не просто список действий.
Объект и предмет исследования
Объект: процесс анализа научных публикаций в библиотеке МТИ.
Предмет: методы автоматического извлечения ключевых предложений из текстов на естественном языке.
Важно: объект — это где применяется система, предмет — что именно вы разрабатываете. Студенты часто путают их. Здесь объект — библиотека, предмет — алгоритм реферирования.
Рекомендуемая структура дипломной работы
| Раздел ВКР | Рекомендуемый объем |
|---|---|
| Введение | 3–5 страниц |
| Аналитическая глава | 25–30 страниц |
| Проектная часть | 30–40 страниц |
| Экономическая глава | 15–20 страниц |
| Заключение | 3–5 страниц |
Пример введения для МТИ
В условиях роста объёмов научной информации возникает острая необходимость в автоматизации анализа текстов. Ежегодно в России публикуется более 120 тыс. научных статей (данные eLibrary, 2024), и ручной анализ становится нереалистичным. Разработка системы автоматического реферирования позволяет сократить время на изучение публикаций в 3–5 раз. Целью ВКР является создание прототипа системы, реализующей метод извлечения ключевых предложений на основе алгоритма TextRank. Объект исследования — процесс анализа научных статей в библиотеке МТИ, предмет — алгоритмы NLP для генерации кратких рефератов. Работа выполнена в соответствии с требованиями ГОСТ 34.602-2020 и методическими указаниями по специальности 09.03.02.
Этапы разработки информационной системы
Как написать заключение по Информационные системы и технологии
В ходе выполнения ВКР был проведён анализ существующих решений по автоматическому реферированию. На основе сравнения алгоритмов выбран метод TextRank как наиболее подходящий для русскоязычных текстов. Разработан прототип системы на Python с использованием библиотеки spaCy. Проведено тестирование на выборке из 50 статей — средняя метрика ROUGE-1 составила 0.68. Экономический эффект от внедрения в библиотеке МТИ оценён в 180 тыс. рублей в год за счёт сокращения трудозатрат. Работа демонстрирует практическую значимость применения NLP-методов в образовательной среде.
Требования к списку литературы МТИ
Список литературы оформляется по ГОСТ Р 7.0.100-2018. Обязательно включить:
- Официальную документацию библиотек (например, spaCy или Hugging Face Transformers).
- Научные статьи по NLP из eLibrary (например, по запросу «автоматическое реферирование»).
- Методические указания МТИ по оформлению ВКР.
⚠️ Типичные ошибки при написании Разработка системы автоматического реферирования научных статей с использованием метода извлечения ключевых предложений
- Ошибка: Использование общих фраз в актуальности → Решение: приведите конкретную статистику (например, рост числа публикаций в РФ).
- Ошибка: Отсутствие реального кода в приложении → Как проверить: добавьте хотя бы 2–3 ключевых функции (например, extract_key_sentences).
- Ошибка: Несоответствие задач цели → Чек-лист: каждая задача должна начинаться с глагола и вести к результату.
- Ошибка: Копирование схем из интернета → Решение: адаптируйте диаграмму под вашу систему, укажите источники.
Частые вопросы по теме «Разработка системы автоматического реферирования научных статей с использованием метода извлечения ключевых предложений»
- В: Нужно ли реальное внедрение системы? О: Нет, достаточно прототипа и расчёта гипотетического эффекта.
- В: Какой алгоритм лучше: TextRank или BERT? О: TextRank проще в реализации и подходит для ВКР. BERT — мощнее, но требует GPU.
- В: Где взять корпус текстов для тестирования? О: Используйте открытые статьи с eLibrary или CyberLeninka.
Вопросы, которые часто задают студенты
- Можно ли использовать Resoomer как аналог?
- Как проверить уникальность кода?
- Обязательно ли делать веб-интерфейс?
✅ Чек-лист перед защитой Разработка системы автоматического реферирования научных статей с использованием метода извлечения ключевых предложений
- □ Все задачи из введения выполнены и отражены в заключении
- □ Код/схемы соответствуют ТЗ и методичке МТИ
- □ Уникальность >75% по Антиплагиат.ВУЗ (настройки вуза)
- □ Источники оформлены по ГОСТ Р 7.0.100-2018
- □ Экономический расчёт содержит реальные данные, а не шаблоны
- □ В приложении есть фрагменты кода и скриншоты интерфейса
Застряли на этапе реализации алгоритма? Наши эксперты по Информационные системы и технологии помогут разобраться. Написать в Telegram или +7 (987) 915-99-32 (WhatsApp)
Проверьте свою тему ВКР
- □ Есть ли реальная организация для анализа?
- □ Есть ли измеримый эффект внедрения?
- □ Можно ли построить диаграммы процессов?
- □ Есть ли реальные данные для экономических расчетов?
Нужна помощь с защитой Разработка системы автоматического реферирования научных статей с использованием метода извлечения ключевых предложений?
Наши эксперты — практики в сфере Информационные системы и технологии. Подготовим работу с глубоким анализом, реальными примерами и расчётами, готовую к защите в МТИ.
Что вы получите: соответствие методичке вуза, гарантию оригинальности от 75%, сопровождение до защиты.
Ответим в течение 10 минут. Консультация бесплатна.






















