
Задача компьютера, прежде всего, заключается в определении предложения, содержащего потенциальный эвфемизм. Киддон и Брюн проанализировали 1,5 миллионов фраз с эротическим смыслом и оценили существительные, прилагательные и глаголы с точки зрения их «сексуальности». Наибольшее значение присвоено в частности словам «rod» (стержень), «meat» (мясо, мякоть), «hot» (горячий) и «wet» (влажный). В русском языке это могли бы быть такие слова, как «конец», «хозяйство», «стоять» и так далее.
Затем в работу включается сама система Double Entendre via Noun Transfer (DeviaNT). Её проверили на сайте фривольного содержания twssstories.com и довольно невинном сборнике цитат wikiquote.org.
Система оказалась точна примерно на 70%. Разработчики утверждают, что показатель оказался обманчиво низким из-за неравноценного объёма источников. Если их уравнять, то возможен результат в 99,5%.
Специалисты собираются представить программу на ежегодном собрании Ассоциации компьютерной лингвистики в июне. В дальнейшем DEviaNT планируется научить другим видам шуток — например, основанным на метафоре, пишет NewScientist.
13.12 02:36
20
Лучшие космические снимки 2012 года
26.11 17:18
17
Редкие звери в объективе камер-ловушек
13.11 17:54
22
Собачий дизайн
09.10 04:39
44
Мила Кунис — «Мисс Сексуальность»
08.10 23:59
42
Кадры из фильма «Хоббит: Нежданное путешествие»
08.10 18:22
25
Тропические сады-теплицы в Сингапуре