Темные данные. Практическое руководство по принятию правильных решений в мире недостающих данных

Text
9
Kritiken
Leseprobe
Als gelesen kennzeichnen
Wie Sie das Buch nach dem Kauf lesen
Keine Zeit zum Lesen von Büchern?
Hörprobe anhören
Темные данные. Практическое руководство по принятию правильных решений в мире недостающих данных
Темные данные. Практическое руководство по принятию правильных решений в мире недостающих данных
− 20%
Profitieren Sie von einem Rabatt von 20 % auf E-Books und Hörbücher.
Kaufen Sie das Set für 10,98 8,78
Темные данные. Практическое руководство по принятию правильных решений в мире недостающих данных
Audio
Темные данные. Практическое руководство по принятию правильных решений в мире недостающих данных
Hörbuch
Wird gelesen Вадим Чернобельский
6,04
Mit Text synchronisiert
Mehr erfahren
Buchbeschreibung

Человечество научилось собирать, обрабатывать и использовать в науке, бизнесе и повседневной жизни огромные массивы данных. Но что делать с данными, которых у нас нет? Допустимо ли игнорировать то, чего мы не замечаем? Британский статистик Дэвид Хэнд считает, что это по меньшей мере недальновидно, а порой – крайне опасно. В своей книге он выделяет 15 влияющих на наши решения и действия видов данных, которые остаются в тени. Например, речь идет об учете сигналов бедствия, которые могли бы подать жители бедных районов, если бы у них были смартфоны, результатах медицинского исследования, которые намеренно утаили или случайно исказили, или данных, ставших «темными» из-за плохого набора критериев для включения в выборку. Хэнд также рассказывает о том, какие меры могут сгладить эффект «темных данных» и как их можно обратить себе на пользу. Книга будет интересна широкому кругу читателей, интересующихся дата-сайенс, программированием и статистикой.

Detaillierte Informationen
Altersbeschränkung:
12+
An folgendem Datum zu LitRes hinzufügt:
02 Februar 2021
Datum der Übertragung:
2021
Schreibdatum:
2020
Größe:
380 S.
ISBN:
9785961458930
Übersetzer:
Михаил Белоголовский
Verleger:
Альпина Паблишер
Copyright:
Альпина Диджитал
Inhaltsverzeichnis
Темные данные. Практическое руководство по принятию правильных решений в мире недостающих данных von Дэвид Хэнд — eBook als epub, txt, mobi, pdf herunterladen oder online lesen. Posten Sie Kommentare oder Kritiken, stimmen Sie für Ihren Favoriten.
Andere Versionen
Темные данные. Практическое руководство по принятию правильных решений в мире недостающих данных
Hörbuch
Wird gelesen Вадим Чернобельский
6,04
Zitate 2

Вы не даете людям лекарств, чтобы отследить их реакцию, не просите выполнить какое-либо задание, чтобы подсчитать, сколько времени это займет, не меняете удобрения, чтобы посмотреть, какие из них дают самый обильный урожай, не пробуете разную температуру воды, чтобы понять, как она влияет на вкус чая.

+4mf_6681371567772549

Медиааналитик Тони Твайман сформулировал закон, получивший известность как Закон Тваймана , который гласит, что любые численные данные, которые выглядят интригующе или как-то выделяются, обычно неверны 58

+2mikhail

Andere haben auch gelesen:

Отзывы 9

Сначала популярные
Михаил Панкратов

Просмотр других отзывов вызывает некоторое недоумение. Эти комментаторы точно читали книгу?

Итак, о чем же книга: эта книга написана президентом Британского Королевского Статистического Общества, и основная ее тема это теория вероятности и математическая статистика. Целевая аудитория – те кому нравится творчество Талеба, Млодинова, Мобуссина и других сходных авторов.

Из того, что я читал, похоже на книгу «Как лгать при помощи статистики» Дарелла Хаффа. Но гораздо глубже и современнее конечно.

В книге разбираются такие вопросы как, например, что делать если в социологическом опросе часть респондентов вообще не ответили на вопросы? Можно их просто не учитывать? (спойлер: нет, нельзя) Ну или как поступать, когда при испытаниях нового лекарства часть испытуемых по собственному желанию вышли из программы досрочно. Можно их просто вычеркнуть, как будто их и не было никогда? (спойлер: снова нет). Вот это и есть те самые «темные данные» которым посвящена книга.

Эта книга НЕ ПРО приватность и сохранность личных данных в интернете. Этот вопрос пару раз упоминается но совершенно мимоходом.

Также эта книга НЕ ПРО Big Data. Все что рассматривается тут это структурированные данные полученные от агентств вроде министерства здравоохранения или в ходе, скажем, клинического эксперимента. Big Data это обработка естественного языка, изображений, звука и видео контента. В книге про это нет ничего или почти ничего.

Этические вопросы сбора данных о людях по большей части тоже лежат за пределами данной книги. Тоже пара упоминаний вскользь о том, что такая проблема в принципе есть – не более того. Так что книга НЕ ПРО это тоже.

Ближе к самой книге: первая половина, на мой взгляд, написана просто отлично. Очень интересно, много классных вопросов и примеров. Все по теме. Вторая половина, к сожалению, огорчает. Автор начинает слишком сильно растекаться мыслями. Получается повествование просто обо всем и в результате ни о чем одновременно. Он пытается охватить сразу и астрофизику и биржевые махинации и медицинские вопросы и вообще все. В итоге повествование теряет фокус, становится расплывчатым и неконкретным.

Было бы лучше, если бы автор пошел не в ширь, а в глубь. То есть более глубоко рассмотрел поднятые им же самим вопросы. Почему промахивались социологические опросы касательно победы Трампа? Почему статистические органы рапортуют аномально низкие показатели инфляции хотя потребители отмечают повышение цен? А промахи опросов касательно брексита? Вот где не мешало бы покопаться в темных данных.

А как насчет проблем с кредитным скорингом перед кризисом 2008 года? Как получалось, что множество заемщиков невероятно низкого качества получило такие объемы кредитов? Я изучал вопрос более глубоко и знаю, что тут тоже не обошлось без изрядной доли темных данных.

В общем, за первую половину книги 5 звезд, а за вторую половину две. В итоге в среднем 3,5 звезды, которые я округлил в пользу автора до 4. Почитать все же стоит.

Alexander Khadzhinov

Мы живем в мире в котором, казалось бы, уже есть бесчисленное множество информации и знаний о каждом из нас. Но на самом деле существует иная сторона – Dark Data – «темные данные», которые хранятся, но нигде не используются! Простой пример – при текущем уровне развития искусственного интеллекта (ИИ), машинного обучения и Интернета вещей (IoT), объём хранимых в мире Dark Data через пять вырастет в 5 раз – до 91 зеттабайт при условии что общий объем Big Data будет составлять по оценкам IDC 175 зеттабайт. На разных примерах Дэвид Хэнд показывает необходимость в идентификации и выявлении этого огромного океана данных, их классификации, а так же изменения политик обработки таких данных. Острая необходимость в этом связана хотя бы с тем что

 Спойлер

"для поглощения выбросов углекислого газа, связанных с хранением «темных данных», потребуется 7 500 000 акров леса (3,0 млн гектаров)" (c)


Сергей

Готовьтесь, будет много цифр. Но прочитать это нужно всем, кто задействован в продажах или занимается распространением своего/чужого творчества. Из приведённых теорий и алгоритмов можно начать интуитивно понимать любые механизмы распространения и хранения данных.

Ivan

Книга может показаться немного сложноватой, но она того стоит. Ещё рекомендую книгу «Формула» Барабаши, подобного плана. Как статистика и информатика поможет увидеть важные или опасные закономерности в повседневности.

julia_nomad

Книга-топ. Достаточно простая, чтобы не считать её академической литературы. Но на весьма сложную и специфическую тему. Напоминает концепцию безмасштабных сетей, но уже в более практическом, конкретном смысле.

Оставьте отзыв