Дипломная работа по прикладной информатике подготовлена и защищена в 2016 году в Кемеровском государственном университете, Факультет математики и компьютерных наук, Кафедра информационных систем, специальность 351400 – Прикладная информатика в экономике.
Наиболее известным способом составления признакового пространства становится метод ключевых слов. В качестве признаков в указанной методе применяются лексемы, входящие в документы, а размерность пространства признаков соответствует размерности словаря. Но подобный метод, например, не поддерживает морфологию языка, а также семантические связи между словами. Учет морфологии реализуется с помощью методов стемминга, базирующегося на приведении слов к их базовой словоформе. При этом для любого языка нужен морфологический анализатор, что, сначала ведет к дополнительной вычислительной нагрузке, а затем возникает задача описания языка документа (если его нет в свойствах документа), а для некоторых языков составление морфологического анализатора становится очень сложной задачей.
В рассматриваемой дипломной работе по информатике в экономике решается проблема создания ИС для автоматической классификации электронных документов. Сама система – это веб-портал для классификации документов.
Рассматриваемая ВКР включает в себя 2 части. В первой указаны методы классификации, алгоритмы классификации и реализована постановка задачи на разработку ИС для автоматической классификации электронных документов, а также приводятся выбранные средства разработки.
Во второй главе показывается интерфейс системы, ее структура, в том числе созданная БД. Здесь же проводится тестирование созданного ПО и сравнение применяемых методов, а именно метода ближайших соседей, его улучшенного варианта и обобщенного метода ближайших соседей.
В комплект дипломной работы по информатике входит программа на языке PHP и СУБД MySQL.