На нашем сайте вы можете читать онлайн «Темные данные. Практическое руководство по принятию правильных решений в мире недостающих данных». Эта электронная книга доступна бесплатно и представляет собой целую полную версию без сокращений. Кроме того, доступна возможность слушать аудиокнигу, скачать её через торрент в формате fb2 или ознакомиться с кратким содержанием. Жанр книги — Знания и навыки, Компьютерная литература, Базы данных. Кроме того, ниже доступно описание произведения, предисловие и отзывы читателей. Регулярные обновления библиотеки и улучшения функционала делают наше сообщество идеальным местом для любителей книг.
Темные данные. Практическое руководство по принятию правильных решений в мире недостающих данных

Автор
Дата выхода
02 февраля 2021
Краткое содержание книги Темные данные. Практическое руководство по принятию правильных решений в мире недостающих данных, аннотация автора и описание
Прежде чем читать книгу целиком, ознакомьтесь с предисловием, аннотацией, описанием или кратким содержанием к произведению Темные данные. Практическое руководство по принятию правильных решений в мире недостающих данных. Предисловие указано в том виде, в котором его написал автор (Дэвид Хэнд) в своем труде. Если нужная информация отсутствует, оставьте комментарий, и мы постараемся найти её для вас. Обратите внимание: Читатели могут делиться своими отзывами и обсуждениями, что поможет вам глубже понять книгу. Не забудьте и вы оставить свое впечатие о книге в комментариях внизу страницы.
Описание книги
Человечество научилось собирать, обрабатывать и использовать в науке, бизнесе и повседневной жизни огромные массивы данных. Но что делать с данными, которых у нас нет? Допустимо ли игнорировать то, чего мы не замечаем? Британский статистик Дэвид Хэнд считает, что это по меньшей мере недальновидно, а порой – крайне опасно. В своей книге он выделяет 15 влияющих на наши решения и действия видов данных, которые остаются в тени. Например, речь идет об учете сигналов бедствия, которые могли бы подать жители бедных районов, если бы у них были смартфоны, результатах медицинского исследования, которые намеренно утаили или случайно исказили, или данных, ставших «темными» из-за плохого набора критериев для включения в выборку. Хэнд также рассказывает о том, какие меры могут сгладить эффект «темных данных» и как их можно обратить себе на пользу. Книга будет интересна широкому кругу читателей, интересующихся дата-сайенс, программированием и статистикой.
Темные данные. Практическое руководство по принятию правильных решений в мире недостающих данных читать онлайн полную книгу - весь текст целиком бесплатно
Перед вами текст книги, разбитый на страницы для удобства чтения. Благодаря системе сохранения последней прочитанной страницы, вы можете бесплатно читать онлайн книгу Темные данные. Практическое руководство по принятию правильных решений в мире недостающих данных без необходимости искать место, на котором остановились. А еще, у нас можно настроить шрифт и фон для комфортного чтения. Наслаждайтесь любимыми книгами в любое время и в любом месте.
Текст книги
Они не охватывают все возможные причины (например, небрежность, допускающую включение в окончательный результат исследования данных пациентов, которые наблюдались недостаточно длительное время), но обеспечивают более общую систематику (например, проводят различие между данными, о которых мы знаем, что они отсутствуют, и данными, о которых мы этого не знаем). Понимание этих DD-типов может помочь вам защититься от ошибок, оплошностей и угроз, вытекающих из самого факта незнания. В этой книге представлены, а в главе 10 обобщены следующие DD-типы:
? DD-тип 1: данные, о которых мы знаем, что они отсутствуют;
? DD-тип 2: данные, о которых мы не знаем, что они отсутствуют;
? DD-тип 3: выборочные факты;
? DD-тип 4: самоотбор;
? DD-тип 5: неизвестный определяющий фактор;
? DD-тип 6: данные, которые могли бы существовать;
? DD-тип 7: данные, меняющиеся со временем;
? DD-тип 8: неверно определяемые данные;
? DD-тип 9: обобщение данных;
? DD-тип 10: ошибки измерения и неопределенность;
? DD-тип 11: искажения обратной связи и уловки;
? DD-тип 12: информационная асимметрия;
? DD-тип 13: намеренно затемненные данные;
? DD-тип 14: фальшивые и синтетические данные;
? DD-тип 15: экстраполяция за пределы ваших данных.
Глава 2
Обнаружение темных данных
Что мы собираем, а что нет
Темные данные со всех сторон
Данные не возникают сами собой. Они не существуют с начала времен, ожидая, пока их проанализируют. Кто-то должен собрать их. И разные методы сбора данных, как вы догадываетесь, порождают разные типы темных данных.
В этой главе мы рассмотрим три основных метода создания наборов данных, а также пути возникновения темных данных, связанные с каждым из них. Следующая глава посвящена дополнительным осложнениям, которые темные данные могут вызывать в разных ситуациях.
Итак, вот три основные стратегии создания наборов данных.
? Сбор данных обо всех интересующих нас объектах.
Именно к этому стремятся, например, во время переписи населения.





