Разработка нейросетевого классификатора электронной почты, ВКР по прикладной информатике в экономике
Получите бесплатно демо-версию Демо-версия - дипломная работа, в котрой удалена часть текста, рисунков, таблиц.Посмотреть все услуги дипломной работы на электронную почту.
Введите адрес электронной почты и нажмите "Отправить"
Разработка автоматизированной системы учета товаров малого предприятия8 748 ₽
Методика обеспечения защиты информации WEB-сервера от XSS атак на основе многокритериального выбора, ВКР безопасность информационных систем11 880 ₽
Построение защищенного электронного документооборота в организации, диплом по защите информации9 000 ₽
Разработка автоматизированной системы учета товаров и продаж для торговой компании9 200 ₽Описание
Работа написана и представлена в 2018 году.
В нашем мире растущий объём информации в электронном виде так или иначе нуждается в классификации для оптимального хранения и обработки. Ручной анализ при таком объеме текстов станет мега затратным как по финансам, так и по человеко-часам. Данную проблему может решить компьютерная авто классификация, в рамках которой компьютерные комплексы справляются с большими объемами данных.
В проекте решается задача разработки ИС для автоматического разделения электронных документов. Система является неким веб-порталом для разделения документов.
Сама ВКР имеет 3 части. В первой описаны методы и алгоритмы классификации и выполнена постановка задачи на создание ИС для автоматического разделения электронных документов, а также выбраны средства разработки.
Вторая глава описывает интерфейс системы, ее структуру, в том числе созданную БД. Тут также проводится проверка новой системы и сравнение применяемых методик, а именно метода ближних соседей, его улучшенного варианта и совокупного метода ближних соседей.
Третья глава включает ЖЦ классификатора и рассчитывает цену разработки.
Разделение текстов — сортировка документов по некоторым категориям — одна их подобных задач.
Методы разделения текстовых документов основаны на стыке пары областей — машинного обучения и поиска данных. Совокупная часть этих областей —методы представления документов и оценка уровня разделения текстов, а различия только в вариантах конкретного поиска.
Главными областями использования классификации текстов становятся: фильтрация спама; разделение новостей; авторская проверка.
Объекты классификации — гипертекстовые и текстовые документы и их части — слабо структурированы различными данными. Многие алгоритмов разделения работают с формальным описанием объектов в рамках векторной модели конкретного документа [1]. В этой модели сам документ выражен вектором, а конкретная длина п, где п — сумма признаков, а г-я компонента вектора отражает вес г-го признака. Для внедрения модели представления важно изначально определить признаковое пространство, а также найти алгоритм подсчета весов. Число выбранной модели представления при конкретном алгоритме разделения и определенным эталонном тестовом наборе документов оценивают по некоторым параметрам:
Уровень разделения: базовый критерий (зависит также от алгоритма разделения);
Размер признакового пространства: при единой последовательности лучшее признаковое пространство меньшей размерности;
Размер итоговой модели разделения: при неизменной точности лучше компактные модели;
Длительность обучения и классификации: особый критерий, который зависит от описанных выше;
Понимание морфологии языка: данный показатель связан в описанными выше, в частности, понимание морфологии приводит к наиболее точным и компактным моделям разделения.
Самым явным вариантов создания признакового пространства становится методика ключевых слов [1, 2]. Признаками в данном методе станут лексемы, входящие в документы, а размерность пространства признаков будет равной размерности словаря. Но такой метод, к примеру, включает морфологию языка, а также некоторые связи между словами. Поддержку морфологии обычно реализуют при помощи стемминга [2], базирующегося на приведении слов к их исходной словоформе. Но в этом случае для любого языка требуется морфологический анализатор, что приводит к повышенной вычислительной нагрузке, а также рождает задачу нахождения языка документа в случае его отсутствия, и важно понимать, что для части языков создание морфологического анализатора очень непростая задача.
В данной ВКР создана ИС, которая помогает классифицировать электронные документы с применением 3 методов классификации; методики ближнего соседа, его обновленного варианта и совокупного метода ближайших соседей.
Сам проекта помимо пояснительной записки содержит программу на PHP и СУБД MySQL.
Характеристики
Файлы схем | да |
Год | 2018 |
Программа с исходниками | да, php |

Огромное спасибо команде за спасение! Честно говоря, у меня уже опускались руки: тема была очень сложной, и я просто не справлялась сама. Веб-дизайн, нейросети. Ребята взялись за работу и сделали всё в супер-сжатые сроки — чуть больше недели! Правки вносили моментально, всё подготовили в лучшем виде. Итог — защита на "отлично"! Безумно благодарна за помощь, вы лучшие!

Хочу выразить огромную благодарность команде diplom-it.ru! Заказывал диплом по направлению «Цифровая экономика» в Университете Синергия. Тема была жутко сложная, связанная с Big Data и прогнозированием, сам бы я точно не справился. Ребята не просто скинули «сырой» текст, а сделали полноценное исследование с актуальными расчетами. Антиплагиат прошел на ура (82% по версии вуза), уникальность текста отличная. Менеджеры на связи 24/7, отвечали даже на глупые вопросы ночью. Защитился на пятерку, комиссия похвалила за практическую часть. Рекомендую! ВУЗ: Синергия, специальность: Цифровая экономика.

Огромный респект команде diplom-it.ru! Ситуация была критическая: до сдачи диплома в МТИ (специальность «Менеджмент в игровой индустрии») оставалось 2 недели, а у меня была только введению и половина первой главы. Думал, все, вылетаю. Ребята взялись за работу моментально. Написали не просто текст, а крутой проект с анализом рынка и финансовой моделью. На защите препод даже удивился, откуда у меня такие свежие данные. Защитился на 5! Очень выручили.

Обращался на diplom-it.ru за помощью с дипломом в МТИ (специальность — прикладная информатика, если это важно). Остался доволен сервисом. Работа была готова раньше срока, что дало время спокойно подготовить речь и раздаточный материал. Оформление полностью по ГОСТу, список литературы свежий. Цена, кстати, оказалась чуть ниже, чем в среднем по рынку, хотя я переживал, что низкая цена = плохое качество. Но нет, тут соотношение цены и качества хорошее. Советую.

Хочу поделиться своей историей успеха с сайтом diplom-it.ru. Учусь в Синергии на факультете психологии. Тема диплома: «Влияние эмоционального интеллекта на успешность в карьере у студентов выпускных курсов». Тема модная, но сырая, литературы много, но нужно было грамотно провести исследование. Я переживала, что автор не сможет правильно составить опросники и обработать данные в SPSS. Каково же было мое удивление, когда в готовой работе я увидела не только качественную теорию, но и шикарную практическую часть с таблицами, корреляционным анализом и понятными выводами! Научный руководитель (довольно строгая женщина) сказала, что это одна из лучших работ за последние годы. Защита на отлично. Спасибо большое автору и персональному менеджеру за поддержку!



























