Разработка нейросетевого классификатора электронной почты, ВКР по прикладной информатике в экономике
Получите бесплатно демо-версию Демо-версия - дипломная работа, в котрой удалена часть текста, рисунков, таблиц.Посмотреть все услуги дипломной работы на электронную почту.
Введите адрес электронной почты и нажмите "Отправить"
Построение защищенного электронного документооборота в организации, диплом по защите информации9 000 ₽
Программные комплексы поддержки принятия управленческих решений (учет рабочего времени сотрудников)10 680 ₽
Разработка автоматизированной системы учета товаров малого предприятия8 748 ₽
Разработка корпоративного мессенджера, дипломная работа по прикладной информатике в экономике10 680 ₽Описание
Работа написана и представлена в 2018 году.
В нашем мире растущий объём информации в электронном виде так или иначе нуждается в классификации для оптимального хранения и обработки. Ручной анализ при таком объеме текстов станет мега затратным как по финансам, так и по человеко-часам. Данную проблему может решить компьютерная авто классификация, в рамках которой компьютерные комплексы справляются с большими объемами данных.
В проекте решается задача разработки ИС для автоматического разделения электронных документов. Система является неким веб-порталом для разделения документов.
Сама ВКР имеет 3 части. В первой описаны методы и алгоритмы классификации и выполнена постановка задачи на создание ИС для автоматического разделения электронных документов, а также выбраны средства разработки.
Вторая глава описывает интерфейс системы, ее структуру, в том числе созданную БД. Тут также проводится проверка новой системы и сравнение применяемых методик, а именно метода ближних соседей, его улучшенного варианта и совокупного метода ближних соседей.
Третья глава включает ЖЦ классификатора и рассчитывает цену разработки.
Разделение текстов — сортировка документов по некоторым категориям — одна их подобных задач.
Методы разделения текстовых документов основаны на стыке пары областей — машинного обучения и поиска данных. Совокупная часть этих областей —методы представления документов и оценка уровня разделения текстов, а различия только в вариантах конкретного поиска.
Главными областями использования классификации текстов становятся: фильтрация спама; разделение новостей; авторская проверка.
Объекты классификации — гипертекстовые и текстовые документы и их части — слабо структурированы различными данными. Многие алгоритмов разделения работают с формальным описанием объектов в рамках векторной модели конкретного документа [1]. В этой модели сам документ выражен вектором, а конкретная длина п, где п — сумма признаков, а г-я компонента вектора отражает вес г-го признака. Для внедрения модели представления важно изначально определить признаковое пространство, а также найти алгоритм подсчета весов. Число выбранной модели представления при конкретном алгоритме разделения и определенным эталонном тестовом наборе документов оценивают по некоторым параметрам:
Уровень разделения: базовый критерий (зависит также от алгоритма разделения);
Размер признакового пространства: при единой последовательности лучшее признаковое пространство меньшей размерности;
Размер итоговой модели разделения: при неизменной точности лучше компактные модели;
Длительность обучения и классификации: особый критерий, который зависит от описанных выше;
Понимание морфологии языка: данный показатель связан в описанными выше, в частности, понимание морфологии приводит к наиболее точным и компактным моделям разделения.
Самым явным вариантов создания признакового пространства становится методика ключевых слов [1, 2]. Признаками в данном методе станут лексемы, входящие в документы, а размерность пространства признаков будет равной размерности словаря. Но такой метод, к примеру, включает морфологию языка, а также некоторые связи между словами. Поддержку морфологии обычно реализуют при помощи стемминга [2], базирующегося на приведении слов к их исходной словоформе. Но в этом случае для любого языка требуется морфологический анализатор, что приводит к повышенной вычислительной нагрузке, а также рождает задачу нахождения языка документа в случае его отсутствия, и важно понимать, что для части языков создание морфологического анализатора очень непростая задача.
В данной ВКР создана ИС, которая помогает классифицировать электронные документы с применением 3 методов классификации; методики ближнего соседа, его обновленного варианта и совокупного метода ближайших соседей.
Сам проекта помимо пояснительной записки содержит программу на PHP и СУБД MySQL.
Характеристики
Файлы схем | да |
Год | 2018 |
Программа с исходниками | да, php |

Заказывал диплом по специальности «цифровая экономика». Думал, что сделают кое-как, но нет: уникальность 87%, куча расчётов в Python. Менеджер ещё предложил дополнительный перечень вопросов с ответами для защиты — я купил, не пожалел. Комиссия спросила про экономическую эффективность, я уже был готов. Спасибо!

РАНХиГС, ГМУ. Заказал ВКР за месяц — сжато, но реально. Работу получил вовремя, антиплагиат 81%. Но в тексте нашёл пару устаревших ссылок (2018 год). Правки сделали, объяснили, что промахнулись. В целом сервис честный, если попросить доработку. На защите проблем не было.

Заказывала ВКР по психологии. Срок 2 месяца. Сделали чётко, уникальность 89%, SPSS, корреляции. Очень боялась защиты — взяла дополнительный пакет вопросов-ответов. И правильно: комиссия спросила про валидность методик, я ответила дословно. Ощущение, что кто-то держал меня за руку. Спасибо команде!

Очень боялась, что после перевода первой части суммы связь с исполнителями просто потеряется. На деле процесс оказался отлаженным: личный кабинет, статусы этапов, быстрый чат с куратором. Был небольшой косяк с первым автором, который не учёл свежие поправки в отраслевых стандартах, но заменили специалиста за сутки. Новая версия полностью соответствовала методичке. В целом надёжно.

Заказывала доработку бакалаврской работы перед самой защитой. Нужно было срочно добавить сравнительный анализ конкурентов. Сделали за два дня, нашли открытые данные, построили матрицу. Без этой главы меня бы просто не допустили. Спасибо за оперативность и понимание студенческих проблем. Буду рекомендовать одногруппникам.
















































