Разработка нейросетевого классификатора электронной почты, ВКР по прикладной информатике в экономике
Получите бесплатно демо-версию Демо-версия - дипломная работа, в котрой удалена часть текста, рисунков, таблиц.Посмотреть все услуги дипломной работы на электронную почту.
Введите адрес электронной почты и нажмите "Отправить"
Описание
Работа написана и представлена в 2018 году.
В нашем мире растущий объём информации в электронном виде так или иначе нуждается в классификации для оптимального хранения и обработки. Ручной анализ при таком объеме текстов станет мега затратным как по финансам, так и по человеко-часам. Данную проблему может решить компьютерная авто классификация, в рамках которой компьютерные комплексы справляются с большими объемами данных.
В проекте решается задача разработки ИС для автоматического разделения электронных документов. Система является неким веб-порталом для разделения документов.
Сама ВКР имеет 3 части. В первой описаны методы и алгоритмы классификации и выполнена постановка задачи на создание ИС для автоматического разделения электронных документов, а также выбраны средства разработки.
Вторая глава описывает интерфейс системы, ее структуру, в том числе созданную БД. Тут также проводится проверка новой системы и сравнение применяемых методик, а именно метода ближних соседей, его улучшенного варианта и совокупного метода ближних соседей.
Третья глава включает ЖЦ классификатора и рассчитывает цену разработки.
Разделение текстов — сортировка документов по некоторым категориям — одна их подобных задач.
Методы разделения текстовых документов основаны на стыке пары областей — машинного обучения и поиска данных. Совокупная часть этих областей —методы представления документов и оценка уровня разделения текстов, а различия только в вариантах конкретного поиска.
Главными областями использования классификации текстов становятся: фильтрация спама; разделение новостей; авторская проверка.
Объекты классификации — гипертекстовые и текстовые документы и их части — слабо структурированы различными данными. Многие алгоритмов разделения работают с формальным описанием объектов в рамках векторной модели конкретного документа [1]. В этой модели сам документ выражен вектором, а конкретная длина п, где п — сумма признаков, а г-я компонента вектора отражает вес г-го признака. Для внедрения модели представления важно изначально определить признаковое пространство, а также найти алгоритм подсчета весов. Число выбранной модели представления при конкретном алгоритме разделения и определенным эталонном тестовом наборе документов оценивают по некоторым параметрам:
Уровень разделения: базовый критерий (зависит также от алгоритма разделения);
Размер признакового пространства: при единой последовательности лучшее признаковое пространство меньшей размерности;
Размер итоговой модели разделения: при неизменной точности лучше компактные модели;
Длительность обучения и классификации: особый критерий, который зависит от описанных выше;
Понимание морфологии языка: данный показатель связан в описанными выше, в частности, понимание морфологии приводит к наиболее точным и компактным моделям разделения.
Самым явным вариантов создания признакового пространства становится методика ключевых слов [1, 2]. Признаками в данном методе станут лексемы, входящие в документы, а размерность пространства признаков будет равной размерности словаря. Но такой метод, к примеру, включает морфологию языка, а также некоторые связи между словами. Поддержку морфологии обычно реализуют при помощи стемминга [2], базирующегося на приведении слов к их исходной словоформе. Но в этом случае для любого языка требуется морфологический анализатор, что приводит к повышенной вычислительной нагрузке, а также рождает задачу нахождения языка документа в случае его отсутствия, и важно понимать, что для части языков создание морфологического анализатора очень непростая задача.
В данной ВКР создана ИС, которая помогает классифицировать электронные документы с применением 3 методов классификации; методики ближнего соседа, его обновленного варианта и совокупного метода ближайших соседей.
Сам проекта помимо пояснительной записки содержит программу на PHP и СУБД MySQL.
Характеристики
Файлы схем | да |
Год | 2018 |
Программа с исходниками | да, php |
Помогли мне доработать и подредактировать мою дипломную работу по программированию. Хотелось хотя бы что-то сделать самому, а когда уже силы кончились обратился сюда. О ребятах я знал от старших по универу, знал, что сервис проверенный, поэтому без сомнений к ним обратился. Особенно понравились комментарии к дописанному коду. Благодаря им я разобрал некоторые моменты, без шуток) По замечаниям дипломного руководителя, кстати, все решалось без доплаты и ждать не пришлось особо.
Были проблемы с дипломной работой. Очень боялся того, что не успею сделать. У нас преподы строгие и нужно было что-то делать. Вообщем, порекомендовали обратится сюда. В итоге, проконсультировали меня по всем моментам. Стало интересно и решил сотрудничать. Порадовал тот факт, что используются современные средства разработки для написания программ. Сдал на 5. Порекомендую
Обращался по вопросу дипломной работы для Синергии. Тема сложная, для меня практически неподъемная, по автоматизации отдела продаж. Ответ на письмо получил быстро, всё доступно написали и объяснили. Такую работу сам бы не одолел, во первых нет достаточно знаний по этой теме, а во вторых времени дефицит перед НГ. Выполнили в срок, обратную связь поддерживали регулярно. Доволен не то слово, спасибо.
Мне надо было срочно написать дипломную работу и тут мне оказали огромную помощь. Здесь помогли с написанием работы по информационным технологиям с отличным результатом. Всё было выполнено в соответствии со всеми требованиями и стандартами, а качество работы было на высоком уровне. Рекомендую.
От всей души хочу поблагодарить компанию за хорошую работу и высокий балл! Нужно было сделать диплом по проектированию информационных систем - тему раскрыли максимально подробно. Все грамотно, складно и информативно - приятно, когда люди ответственно относятся к своей работе. Считаю, что цена за услуги компании полностью оправдана высоким качеством.