Umfang 348 seiten
2017 Jahr
Все лгут. Поисковики, Big Data и Интернет знают о вас всё
Über das Buch
Люди склонны преувеличивать и не договаривать, опросы не показывают всей картины, исследования недостаточно репрезентативны ‒ в общем, лгут все… Кроме Big Data! Перед вами сенсационная книга о том, как при помощи больших данных и современных технологий можно узнать всю подноготную современного общества.
Как часто мы на самом деле занимаемся сексом? Почему, вопреки общественному мнению, на президентских выборах США победил Трамп? Что мы в действительности думаем о людях другой расы? Социологические исследования и опросы, как оказалось, не в состоянии ответить правдиво на эти и многие другие важные вопросы. Поэтому Cет Cтивенс-Давидовиц, специалист Google по Data Science, обратил свой взгляд на Big Data, а также на всю ту информацию, которую может предоставить Интернет. Результаты получились не просто интересными, а сногсшибательными! Автор раскрыл всю правду о современном обществе.
«Автор подводит нас к мысли, что данные – это жизненная необходимость для современного мира. И это правда. Современная наука о данных за последнее десятилетие сделала огромный скачок вперед. Сейчас проще найти отрасль деятельности, в которой применяются Большие данные, нежели обратное. И хотя эта книга не научит вас пользоваться технологиями обработки данных и механизмами их интерпретации, она расскажет о том, какими они бывают и в какую сторону все движется. В ней скорее примеры и размышления, а не инструкция по применению. А дальше все в ваших руках»,– Леонид Черный, директор по развитию бизнеса «Рамблер Интернет Холдинг».
Genres und Tags
Типичная книга псевдо-знаний :) Как и все подобные книги в нее вложено 5-10 фактов, каждый факт обсасывается просто до потери смысла и читателя заваливают громадным количеством слов, которые на самом деле являются просто информационным шумом. На каждый мизерный факт приводятся столь многословные примеры и ситуативные иллюстрации, что это просто «размывает» всю, хоть сколько-нибудь, познавательную часть книги.
Такие книги хорошо было бы читать в кратком пересказе, чтоб страницы 2-3 краткой «выжимки» с основными идеями, а не сотни бессмысленных страниц.
С самого начала мне показалось что книга очень похожа на книгу «Фрикономкика» Стивена Левитта. Собственно я был прав и в заключении автор так и пишет, что он хотел написать ей продолжение.
В целом данная книга, как и Фрикономика представляет собой, скорее набор забавных анекдотов с крайне поверхностным анализом. Например, когда автор анализирует поисковую статистику, ну скажем порнографических сайтов он при этом почему то ничего не пишет о том какую часть поисковый траффик занимает в общем потоке посетителей. Но ведь многие пользователи могут вообще не пользоваться поиском и приходить в ту или иную категорию по каталогу. Учет этих пользователей перевернет все выводы автора с головы обратно на ноги.
То же самое касательно утверждений про расистские сайты типа stormfront. Если человек интересуется темой то ему не надо вбивать этот сайт в поисковике – он у него уже есть в закладках. Да и запомнить адрес не сложно. То есть всплеск поисковых запросов с такой тематикой говорит скорее о том, что расистов в регионе мало, иначе они бы не искали, а знали куда идти. Автор почему то вообще не уделяет внимания другим видам траффика кроме поискового. Также из анализа автора непонятно, если есть скажем 100 запросов, то это 100 человек по одному запросу или один человек запросил одно и то же 100 раз. Вообще возникает ощущение, что ему главное сбыть «жареную сенсацию» а не реальный анализ.
Некоторые данные автора вызывают глубочайшее недоумение. Так например в главе «что на самом деле происходит в наших регионах» автор приводит поисковую статистику касательно того что ищут в связке с основой «как во время беременности…» и дает например, что в первой пятерке в США запросы «предотвратить растяжки» и «избежать растяжек». Но это же один и тот же запрос, просто сформулированный по разному! Любой самый начинающий SEO-оптимизатор знает понятие поискового кластера. Кластер это запросы которые пишутся по разному но на самом деле означают одно и то же. Если считать не по кластерам, а по отдельным запросам то по запросам которые имеют много альтернативных формулировок частота будет многократно занижена. Автор точно специалист по анализу поискового спроса???
Большая часть книги НЕ про большие данные, а скорее про методы регрессии. То есть автор анализирует преимущественно данные о поисковых запросах предоставленные ему поисковиком в СТРУКТУРИРОВАННОМ виде – то есть в виде подготовленном к анализу математическими методами. Он (за исключением пары глав) не анализирует текстовый контент на естественном языке а вопросы распознавания графического контента или видеопотока вообще не упоминаются. Хотя именно это и есть большие данные.
Отдельное спасибо переводчикам: так например великий русский математик Андрей Николаевич Колмогоров в обратном переводе превратился в Холмогорова.
Книга действительно интересная. Но я бы не согласился с предыдущим автором комментария, что она вызовет шок у перевернет жизнь. Да, она рассказывает о том, что люди чаще всего не задумываются над тем, что делают в интернете; что у большинства пользователей интернета лишь иллюзии своей безнаказанности и полной анонимности. Отлично показаны методы, как можно определять мнения сообществ и предложен к внимательному рассмотрению инструментарий онлайн-сервисов. Здесь описано то, что каждый пользователь сети должен знать, чтобы не попасть в неприятную ситуацию. Не нужно чего-то пугаться, доводить себя до паранойи после прочтения книги. Это лишь среда, умело пользуясь преимуществами которой можно получать необходимую информацию. А весь тот информационный мусор из информационного пузыря никак не мешает тому, кто поставил перед собой конкретные цели и планомерно движется к их достижению.
Примеры в книге достаточно простые чтобы их понял начинающий пользователь. Какими-то заумными терминами книга не загружена. Даже часть книги уже была бы полезна для любителей побродить по просторам интернета. Но, думаю, если уж начнете читать и сразу не осилите полностью, непременно со временем по мере встречи с некоторыми возможностями бескрайней сети все равно вернетесь и дочитаете книгу до конца.
Шок! Это страшная книга! Жизнь, после ее прочтения, никогда у вас не станет прежней.
Думаю, что эту книгу надо предварять большим дисклеймером о снятии с себя ответственности за возможные приступы паранойи у читателя.
Я, конечно, знал от Доктора Хауса, что «все врут», но настолько!
Узнать огромное количество шокирующих вещей автору помогают «Большие данные» или по-умному «Big Data». Чтобы всем было понятно, что это такое, автор сразу приводит конкретные примеры из сервисов Google: Тренды и поисковик. Они, как раз, построены на «больших данных».
Чем же так «страшна», особенно для параноиков, эта книга?
Дело в том, что «большие данные» знают ВСЕ! Поэтому опасения одержимых данным психозом, что за нами постоянно подсматривают, подслушивают и это все записывают могут еще больше укорениться. Но параноики здесь не правы. Парадокс ситуации в том, что ни «кто-то», а мы сами о себе охотно размещаем такую информацию. Нет, я не буду дальше философствовать на тему пользы или вреда соцсетей. Дело не в них.
Дело в том, что вы сами, задавая вопросы Гуглу и другим поисковикам, делитесь своими сокровенными мыслями и мечтами: «Мой муж хочет, чтобы я кормила его грудью», «Можно ли загорать во время беременности?» и так далее и тому подобное.
А особенно интересна статистика, которую приводит автор из тематических источников «для взрослых». Чтобы вы не подумали, что я здесь собрался рекламировать какие-то ресурсы, не буду называть сайт, но автор не стесняется и называет его прямо. Кстати, в Америке, лиц мужского пола с нетрадиционной ориентации где-то процентов 5. Так что об этом больше говорят, чем есть на самом деле.
Помните! Когда вы удаляетесь с ноутбуком или каким-то другим гаджетом в укромное и уединенное место, интернет и «Big Data», фактически вламываются к вам и выставляют вас на общее обозрение.
Конечно, в большинстве своем эти данные обезличены и не всегда по ним можно найти конкретного человека, но мы, в большинстве своем, одинаковы, не только на постсоветском пространстве, но и на всем земном шарике.
Книга шокирующая, но автор меня успокоил. Если вы тоже переживали и думали, что к победе Трампа имели отношение русские хакеры, так вот, у автора для нас хорошие новости – это не так. Также американцам было абсолютно безразлична национальность и цвет кожи Барака Обамы.
Не каждый читатель добирается до конца этой книги, по заверениям автора, но я дошел до конца! Крепитесь!
На самом деле, я думаю, что эта книга вам «зайдет» на одном дыхании, настолько она интересна!
Михаил Апостолов,
..."На самом деле, я думаю, что эта книга вам «зайдет» на одном дыхании, настолько она интересна!" "Опасайтесь-паранойи!.."
вы похоже оптимист-неубиваемый с задатками психиатора. Но хочу вас разочаровать:
факты изложенные в книге давно уже не nou-hau в информационном мире.
... и паранойя может скорее возникнуть от стойкого и повсеместного отрицания фактов приведенных в книге
Прочитал первые несколько страниц, расстроила локализация, когда Колмогорова обозвали Холмогоровым. Книгу сжёг, купил оригинал на английском, советую и вам так сделать. Переводчикам привет
Более 40 % инженеров одной компании заявили, что входят в 5 % лучших работников. Более 90 % преподавателей колледжей говорят, что уровень их квалификации выше среднего. Четверть старшеклассников считают, что они входят в 1 % лучших учеников по умению ладить с другими людьми.
). Но насколько значимо это влияние? Если у вас достаточно оптимистичное представление об эффективности антидепрессантов, вы с удивлением обнаружите: даже самые лучшие препараты снижают уровень депрессии всего лишь на 20 %. Насколько можно судить по цифрам, предоставляемым Google, переезд из Чикаго в Гонолулу будет как минимум вдвое эффективнее, чем любое лекарство от зимней тоски 23
пострадали по милости Yelp 224 . Сравнивая отзывы с
Подобное ощущение усилилось после выхода бестселлера Малкольма Гладуэлла «Blink» («Миг»), в котором воспевается магия человеческих инстинктов. Гладуэлл рассказывает истории о людях, которые, полагаясь исключительно на свою интуицию, могут сказать, является ли статуя поддельной, еще до удара – промажет ли теннисист по мячу или сколько клиент готов заплатить – до того, как тот откроет рот. Герои этой книги не высчитывают регрессии, они не определяют доверительные интервалы и не запускают тесты Холмогорова – Смирнова, но при этом, как правило, делают удивительные прогнозы. Многие люди подсознательно поддерживают мнение Гладуэлла об интуиции – они доверяют своему нутру и своим чувствам. Фанаты романа наверняка восторженно подчеркнут мудрость моей бабушки и ее способность давать советы по поводу человеческих отношений без помощи компьютеров. Поклонники «Blink», уверен, менее склонны восхищаться моими исследованиями или другими наработками,
Даже если вы никогда не узнаете, как работает регрессия, и не можете рассчитать доверительный интервал, вы наверняка столкнетесь с большим количеством данных – на страницах книг, которые читаете, во время деловых встреч, в которых принимаете участие, в сплетнях,
Bewertungen, 38 Bewertungen38