2020667189

Модуль препроцессинга неструктурированного текста с применением технологий искусственного интеллекта

Заявка:

2020666598 14.12.2020
7 (499) 263-69-84; patent.bmstu@mail.ru

Программа предназначена для очистки текста от неинформативных признаков, таких как знаки препинания, предлоги, специальные символы и подобные элементы, в которых отсутствует информативность. Также программа осуществляет приведение к нижнему регистру шрифта, лемматизацию текста и токенизацию, создание словаря на основе модели “Bag of Words”. В основе программы лежат алгоритмы искусственного интеллекта. Тип ЭВМ: IBM PC-совмест. ПК. ОС: Linux.