Разработка нейросетевого классификатора электронной почты, ВКР по прикладной информатике в экономике
Получите бесплатно демо-версию Демо-версия - дипломная работа, в котрой удалена часть текста, рисунков, таблиц.Посмотреть все услуги дипломной работы на электронную почту.
Введите адрес электронной почты и нажмите "Отправить"
Описание
Работа написана и представлена в 2018 году.
В нашем мире растущий объём информации в электронном виде так или иначе нуждается в классификации для оптимального хранения и обработки. Ручной анализ при таком объеме текстов станет мега затратным как по финансам, так и по человеко-часам. Данную проблему может решить компьютерная авто классификация, в рамках которой компьютерные комплексы справляются с большими объемами данных.
В проекте решается задача разработки ИС для автоматического разделения электронных документов. Система является неким веб-порталом для разделения документов.
Сама ВКР имеет 3 части. В первой описаны методы и алгоритмы классификации и выполнена постановка задачи на создание ИС для автоматического разделения электронных документов, а также выбраны средства разработки.
Вторая глава описывает интерфейс системы, ее структуру, в том числе созданную БД. Тут также проводится проверка новой системы и сравнение применяемых методик, а именно метода ближних соседей, его улучшенного варианта и совокупного метода ближних соседей.
Третья глава включает ЖЦ классификатора и рассчитывает цену разработки.
Разделение текстов — сортировка документов по некоторым категориям — одна их подобных задач.
Методы разделения текстовых документов основаны на стыке пары областей — машинного обучения и поиска данных. Совокупная часть этих областей —методы представления документов и оценка уровня разделения текстов, а различия только в вариантах конкретного поиска.
Главными областями использования классификации текстов становятся: фильтрация спама; разделение новостей; авторская проверка.
Объекты классификации — гипертекстовые и текстовые документы и их части — слабо структурированы различными данными. Многие алгоритмов разделения работают с формальным описанием объектов в рамках векторной модели конкретного документа [1]. В этой модели сам документ выражен вектором, а конкретная длина п, где п — сумма признаков, а г-я компонента вектора отражает вес г-го признака. Для внедрения модели представления важно изначально определить признаковое пространство, а также найти алгоритм подсчета весов. Число выбранной модели представления при конкретном алгоритме разделения и определенным эталонном тестовом наборе документов оценивают по некоторым параметрам:
Уровень разделения: базовый критерий (зависит также от алгоритма разделения);
Размер признакового пространства: при единой последовательности лучшее признаковое пространство меньшей размерности;
Размер итоговой модели разделения: при неизменной точности лучше компактные модели;
Длительность обучения и классификации: особый критерий, который зависит от описанных выше;
Понимание морфологии языка: данный показатель связан в описанными выше, в частности, понимание морфологии приводит к наиболее точным и компактным моделям разделения.
Самым явным вариантов создания признакового пространства становится методика ключевых слов [1, 2]. Признаками в данном методе станут лексемы, входящие в документы, а размерность пространства признаков будет равной размерности словаря. Но такой метод, к примеру, включает морфологию языка, а также некоторые связи между словами. Поддержку морфологии обычно реализуют при помощи стемминга [2], базирующегося на приведении слов к их исходной словоформе. Но в этом случае для любого языка требуется морфологический анализатор, что приводит к повышенной вычислительной нагрузке, а также рождает задачу нахождения языка документа в случае его отсутствия, и важно понимать, что для части языков создание морфологического анализатора очень непростая задача.
В данной ВКР создана ИС, которая помогает классифицировать электронные документы с применением 3 методов классификации; методики ближнего соседа, его обновленного варианта и совокупного метода ближайших соседей.
Сам проекта помимо пояснительной записки содержит программу на PHP и СУБД MySQL.
Характеристики
Файлы схем | да |
Год | 2018 |
Программа с исходниками | да, php |

Я в полном восторге! Заказала здесь диплом по психологии (тема была очень узкая, связанная с тревожностью у студентов) для МУ им. Витте. Сомневалась до последнего. Автор сработал блестяще! Не просто собрал теорию, а грамотно составил программу эмпирического исследования, предложил релевантные методики. Работа была глубокой и действительно научной. При защите комиссия отметила практическую значимость и качественный анализ данных. Рекомендую всем студентам-психологам, кто хочет сэкономить нервы и время!

Обратился в компанию для разработки выпускной квалификационной работы по бизнес-информатике. ВУЗ — МИРЭА, тема касалась анализа ИТ-инфраструктуры и предложений по ее оптимизации. Работу выполнили в оговоренные сроки. Текст был структурирован, содержал не только теоретическую часть, но и грамотно проработанный аналитический раздел с расчетами. Все требования вуза (включая оформление) были соблюдены. Внес пару правок по практической главе — исполнитель отреагировал оперативно. Работа защищена на хорошо. В целом, услуга соответствует заявленной стоимости. Рекомендую.

Работа была сложная, на стыке нескольких областей. Требовалось не просто описать технологию, а спроектировать архитектуру решения и разработать план его внедрения с расчетом экономической эффективности. Меня привлекло то, что со мной работал не один автор, а команда (куратор, технический специалист по блокчейну и экономист). Результат превзошел ожидания: был предоставлен детальный технический проект, написанный с использованием профессиональной нотации (UML), проведен SWOT-анализ внедрения и рассчитан срок окупаемости. Для защиты подготовили яркую презентацию и тезисы. Работа получила высокую оценку за комплексный подход.

Тема про аудит безопасности. Всё четко, по делу, без воды. Спасибо.

Сроки поджимали, до защиты оставалось меньше месяца. Обратился сюда как в последнюю инстанцию. Менеджер сразу предупредил о возможной доплате за срочность, но подключил самого опытного автора по 1С. Коммуникация была на высоте: автор выходил на связь в любое время суток, согласовывал каждый раздел. Работа была выполнена за 3 недели. Она включала не только теорию по ERP-системам, но и детальное описание конфигурации под конкретный бизнес-кейс, что было ключевым требованием в «Синергии». Несмотря на спешку, оформление было идеальным. Сдал без проблем, спасибо за ответственность.