Analysis of short unstructured documents using fuzzy significance scales and special procedures for economic information integration. Т. В. Какатунова и др.
- Тип: Текст PDF
- Авторы:
- Издательство: Синергия(2020)
- Серия: Прикладная информатика. Научные статьи
- Год написания: 2019
- ISBN: 978-5-04-225131-3
- Страниц: 6
- Язык: Английский
152 руб.
Отложить
- Жанры: Информатика и вычислительная техника
- Теги:
- Описание
- Фрагмент
В статье предложен новый подход к автоматическому анализу коротких сообщений, поступающих на Интернет-порталы и электронную почту органов государственной власти. Разработанная модель позволяет выполнять классификацию коротких неструктурированных текстовых документов при недостатке статистической информации и слабой степени пересечения тематических рубрик. Входными данными для алгоритма построения модели является множество рубрик и обучающая выборка, а его результатом являются нечеткие весовые коэффициенты значимых слов тезаурусов рубрик, что обеспечивает корректное представление характеристик документа и работу алгоритма рубрицирования (классификации).