Учеными был разработан алгоритм, который научит компьютер отличать новостные сообщения от художественной литературы. Алгоритм действий находиться в стадии редактирования и пока не опубликован.
Система по которой работает алгоритм проста: анализируется сколько раз то или иное слово встречается вместе с другими словами в художественном тексте и новостном сообщении. Далее результаты сравниваются.
Исследователи проводили эксперимент: были выбраны произведения писателей 20 века и новостной сайт National Public Radio. Точность угадывания новостных заметок составила 69,1%, с погрешностью 1,22 процента; для рассказов – 73,8 процента с погрешностью 5,15 процента.
Это не первое подобное использование компьютера для анализа текстов, разработанное учеными. Ранее исследователи разработали алгоритм, согласно которому компьютер мог расшифровать один из мертвых языков семитской группы.