Культуромика для студентов ВУЗа

07.07.2014

Культуромика для студентов ВУЗаФилологический факультет ВШЭ совместно с «Афиша Рамблер» открывают несколько проектов по культуромике. «Имена времени» на данный момент только первых их презентованный проект, который был торжественно представлен на фестивале «Политех»

Культуромика? Что это?

Новое направление исследования в области гуманитарии, которое имеет в свою очередь дело с «оцифровкой» слов называется культуромикой. Вся команда состоит из 17 различных научных центров. Жан-Батист Мишель и Эрез Либерман Эйден стали номером один в изучении гуманитарии. В американском журнале Science не далее чем в 2010 году были напечатаны первые исследовательские результаты эксперимента.

Google Books был выбран в качестве базы исследования. Вся задумка основателей данного направления заключается в том, чтобы при помощи статистики, а именно частота употребления слова в больших по размеру массивах, изучать процессы, которые происходят в жизни общества и культуры, а также составить график падения и подъема внимания общественности на различные культурные объекты и понятия.

Одним из известных опытов принято считать: команда взялась за изучение частоты упоминания имени Марка Шагала, и увидела то, что чаще всего его употребляли на английском языке, ежели в период нацисткой Германии. Это исследование должно послужить для выявления частоты упоминаний различных деятелей культуры и не только. К примеру: часто от жителей России можно услышать сочетания слов «лихие девяностые», а вот каким период запомнился, поможет осуществить данный проект.

Программа

Культуромика для студентов ВУЗа

Google Ngm это специально созданная программа, задача которой является помощь при различного рода исследований по культуромике. Такая программа предоставляет возможность поиска, как сочетания нескольких слов, так и по отдельности найденные слова. Вышка использовала эту программу несколько иначе: были выбраны иные методы для исследования, а также основывались на другой базе Национальном корпусе русского языка. Размер необходимой информации значительно меньше, чем у Google Books, зато эта информационная база предоставляет возможность сортировки по датам создания.

Исходные данные дополнены тем, что помимо литературы культурного и научного плана, в список входят СМИ. Вот, например: тематикой первого своего исследования Вышка выбрала дураков, коррупцию, воровство и дороги. Эти темы являются «классикой» для России. Специалисты по лингвистике смогли увидеть, насколько сильно изменилось первоначальное понятие до нынешнего времени. Вся выбранная база явилась очень разнообразной и богатой на сочетание таких слов. Поэтому становиться несколько трудным, определить процент изменения слов и словосочетаний.