Оцифровка книг позволит по-новому изучать историю мира

Читати цю новину російською мовою
Оцифровка книг позволит по-новому изучать историю мира
Ученые предложили новую область знаний – культуромику. Она основана на данных статистического анализа оцифрованных книг, связана с «количественным» изучением истории языка и словесности

Ученые предложили новую область знаний – культуромику. Она основана на данных статистического анализа оцифрованных книг, связана с «количественным» изучением истории языка и словесности, а также проявлений того или иного культурного феномена в истории, пишет РИАновости.

Совместная работа ученых Гарвардского университета и специалистов подразделения компании Google, занимающегося оцифровкой и распространением книг в сети, основана на огромном цифровом материале, накопленном интернет-компанией. Google на сегодня оцифровал примерно 15 миллионов книг, что составляет 12% всех когда-либо издававшихся томов.

Этот массив содержит 500 миллиардов слов, прочесть которые не под силу ни одному человеку.

Однако компьютерный статистический анализ позволяет проводить быстрый поиск слов и символов по всей базе данных, благодаря чему можно быстро отслеживать проявления того или иного культурного феномена в ходе истории, который нашел отражение в книгах.

Например, анализ позволил ученым выяснить, что пик популярности актеров приходится на 30 лет — именно в этом возрасте они наиболее часто упоминаются в печати. Писатели восходят на вершину славы на 10 лет позже, имена ученых же часто упоминают лишь в исключительных случаях и, главным образом, уже по достижению ими преклонного возраста. При этом физикам и биологам отводится куда больше внимания, нежели математикам.

Более масштабный анализ позволил ученым оценить историю развития английского языка в ХХ столетии. Согласно выводам команды исследователей, возглавляемой Жаном-Баптистом Мишелем (Jean-Baptiste Michel) из Гарвардского университета, сегодня английский язык содержит порядка миллиона слов. За последние 50 лет его словарный запас вырос почти на 70%, а скорость роста составила примерно 8,5 тысяч слов в год. Впрочем, в настоящее время в разговоре или письме используется лишь половина этого лексикона.

Как показали ученые, свой отпечаток на язык накладывают и внешние факторы, в частности, политические режимы.

Например, упоминания художника Марка Шагала, еврея по национальности, в печатной продукции нацистской Германии 1936-1944 годов не встречаются практически ни разу, тогда как в англоязычных источниках попадаются достаточно часто. Аналогичная ситуация наблюдается в отношении Льва Троцкого в определенный период истории Советского Союза или площади Тяньаньмэнь, где в 1989 году прошли массовые волнения, в китайских источниках.

С помощью этого статистического подхода, как показали ученые, можно проследить влияние внешних факторов на проявление в культуре таких понятий, как феминизм, бог, эволюция, здоровый образ жизни и других, в той или иной степени интересующих каждого члена общества.

«Культуромика расширяет границы возможного до настоящего времени количественного анализа большого количества явлений в социальной сфере и гуманитарных науках. Изучение культурного отпечатка конкретного понятия в истории интересно многим людям, однако мы надеемся, что наш подход будет особенно активно использоваться учеными, изучающими гуманитарные науки и социальные дисциплины», — сказал Эрез Либерман Эйден (Erez Lieberman Aiden), соавтор публикации, слова которого приводит пресс-служба Гарвардского университета.

Источник: Власти.нет

  • 90
  • 20.12.2010 22:21

Коментарі до цієї новини:

Останні новини

Головне

Погода