Google проследил эволюцию языков за последние 200 лет

17.12.2010, 18:53

рост употребления слов «потепление» и «интернет» в процентах от общего числа слов

Фото: ngrams.googlelabs.com

Поисковый сервис Google был приспособлен специалистами для проведения масштабных лингвистических исследований. Это позволило проследить эволюцию языка в последние 200 лет на основе 5 миллионов отсканированных книг, сообщает New Scientist.

До сих пор у лингвистов не было инструмента, при помощи которого можно было бы проанализировать значительное количество текстов. Авторы нового исследования использовали книги, уже переведенные в цифровой формат — всего около 15 миллионов.

Ученые выбрали из них треть текстов (5,2 миллиона книг на английском, французском, испанском, немецком, китайском и русском языках) и составили базу всех использованных в них слов. Их оказалось около 500 миллиардов.

Анализ полученных данных привел авторов работы к ряду заключений. В частности, они установили, что за последние сто лет число часто используемых слов возросло вдвое — с приблизительно 544 тысяч в 1900 году до миллиона в 2000 году, причем 52 процента новых слов стало активно употребляться после 1950-х годов.

Также специалисты изучили влияние цензуры на использовании тех или иных слов. Выяснилось, что после 1989 года словосочетание «площадь Тяньаньмень» практически перестало встречаться в литературе, изданной в Китае. То же самое произошло с именем Лев Троцкий в СССР в 1940-е годы и с именами голливудских актеров, уличенных в связях с Советским Союзом в США.

Авторы и их коллеги полагают, что новый инструмент позволит ученым исследовать слова и лингвистические тенденции, используя те же подходы и методы, что и специалисты по естественным наукам, передает Lenta.Ru.

Наука Технологии Софт Google