Программа предназначена для очистки текста от неинформативных признаков, таких как знаки препинания, предлоги, специальные символы и подобные элементы, в которых отсутствует информативность. Также программа осуществляет приведение к нижнему регистру шрифта, лемматизацию текста и токенизацию, создание словаря на основе модели “Bag of Words”. В основе программы лежат алгоритмы искусственного интеллекта. Тип ЭВМ: IBM PC-совмест. ПК. ОС: Linux.