Umfang 318 seiten
2013 Jahr
Неизведанная территория. Как «большие данные» помогают раскрывать тайны прошлого и предсказывать будущее нашей культуры
Über das Buch
Насколько велики на самом деле «большие данные» – огромные массивы информации, о которых так много говорят в последнее время? Вот наглядный пример: если выписать в линейку все цифры 0 и 1, из которых состоит один терабайт информации (вполне обычная емкость для современного жесткого диска), то цепочка цифр окажется в 50 раз длиннее, чем расстояние от Земли до Сатурна! И тем не менее, на «большие данные» вполне можно взглянуть в человеческом измерении. Эрец Эйден и Жан-Батист Мишель – лингвисты и компьютерные гении, создатели сервиса Google Ngram Viewer и термина «культуромика», показывают, каким образом анализ «больших данных» помогает исследовать трудные проблемы языка, культуры и истории.
Для тех, кто ранее не сталкивался с возможностями (как впрочем и опасностями) анализа больших массивов данных, книга будет очень интересна. Основное внимание здесь уделяется новым перспективам исследований в гуманитарных науках: истории, социологии, филологии. Этот новый подход позволяет минимизировать мотивационные искажения исследователя на результаты, позволяет получать более объективную картину. Занятно, что этот инструмент исследования доступен каждому пользователю Интернета. Любой может проверить свои гипотезы на большом массиве данных Google Ngram Viewer.
Книга больше даже не про большие данные а про английский язык и его развитие в современном мире, я бы даже сказал это логическое продолжение книги Брэгга «Приключения английского языка». На основании этого можно предполагать что и русский и любой другой язык неминуемо ждут подобные эксперименты и изменения, но если вы не знаете английский то можете не понять о чем речь. Также если считаете что книга айтишная, то тоже будете разочарованы.
дущем. Сотрудники компании Google под руководством программиста Джереми Гинсбурга обратили внимание, что люди значительно чаще ищут информацию о симптомах гриппа, его осложнениях и методах лечения во время эпидемии[21]. Они воспользовались этим вполне очевидным фактом для решения более важной задачи – создания системы, изучающей в режиме реального времени, что ищут через Google жители определенного региона, и позволяющей предсказать возникновение эпидемии гриппа. Эта система раннего предупреждения смогла выявлять новые эпидемии значительно быстрее, чем Центры по контролю и профилактике заболеваний США (несмотря на тот факт, что у этих центров имеется разветвленная и дорогостоящая инфраструктура для решения именно этой задачи).
объявил, что Обама с вероятностью 90,9% выиграет у Ромни, и точно предсказал победителя выборов в округе Колумбия и каждом из штатов (включая, конечно же, Индиану). Этот список можно продолжать до бесконечности. Используя большие данные, исследователи в наши дни проводят эксперименты, о которых их предшественники не могли и мечтать.
Bewertungen, 2 Bewertungen2