Компьютер научился отличать сказку от были

Ученые создали метод, что разрешает компу отличать новостные сообщения от художественных текстов, а конкретно рассказов.

Метод, придуманный создателями научной работы, разбирает, сколько раз хоть какое слово из текста видится совместно с другими словами в рассказах и новостных сообщениях. Приобретённые эти позднее ассоциировали.
Оказалось, что для 2-ух данных типов текстов этот показатель приметно отличается.

Исследователи удостоверились в надежности сделанную ими методику при помощи четыреста новостных заметок, случайным образом избранных с новостного сайта National Public Radio, и четыреста случайных рассказов из базы электрической библиотеки проекта "Гутенберг". Чтобы исключить воздействие исторических изюминок языка, создатели выбирали для анализа произведения писателей XX века.

Для новостных заметок точность угадывания составила 69,1 процента с погрешностью 1,22 процента, а для рассказов – 73,8 процента с погрешностью 5,15 процента.

Похожие записи