Главная » Знания и навыки » Частотный анализ числовых и текстовых данных. Учебное пособие (сразу полная версия бесплатно доступна) Валентин Юльевич Арьков читать онлайн полностью / Библиотека

Частотный анализ числовых и текстовых данных. Учебное пособие

На нашем сайте вы можете читать онлайн «Частотный анализ числовых и текстовых данных. Учебное пособие». Эта электронная книга доступна бесплатно и представляет собой целую полную версию без сокращений. Кроме того, доступна возможность слушать аудиокнигу, скачать её через торрент в формате fb2 или ознакомиться с кратким содержанием. Жанр книги — Знания и навыки, Словари, справочники, Руководства. Кроме того, ниже доступно описание произведения, предисловие и отзывы читателей. Регулярные обновления библиотеки и улучшения функционала делают наше сообщество идеальным местом для любителей книг.

0 баллов
0 мнений
0 чтений

Дата выхода

12 апреля 2023

Краткое содержание книги Частотный анализ числовых и текстовых данных. Учебное пособие, аннотация автора и описание

Прежде чем читать книгу целиком, ознакомьтесь с предисловием, аннотацией, описанием или кратким содержанием к произведению Частотный анализ числовых и текстовых данных. Учебное пособие. Предисловие указано в том виде, в котором его написал автор (Валентин Юльевич Арьков) в своем труде. Если нужная информация отсутствует, оставьте комментарий, и мы постараемся найти её для вас. Обратите внимание: Читатели могут делиться своими отзывами и обсуждениями, что поможет вам глубже понять книгу. Не забудьте и вы оставить свое впечатие о книге в комментариях внизу страницы.

Описание книги

Данная работа посвящена применению современных методов и технологий больших данных в курсе бизнес-аналитике и статистики. Анализ частоты появления различных значений — один из способов первоначальной обработки данных. Чаще всего его относят к описательной статистике или аналитике. Подсчет частот имеет отношение распределению. Поэтому для успешного восприятия материала желательно освежить в памяти основы теории вероятностей и математической статистики.

Частотный анализ числовых и текстовых данных. Учебное пособие читать онлайн полную книгу - весь текст целиком бесплатно

Перед вами текст книги, разбитый на страницы для удобства чтения. Благодаря системе сохранения последней прочитанной страницы, вы можете бесплатно читать онлайн книгу Частотный анализ числовых и текстовых данных. Учебное пособие без необходимости искать место, на котором остановились. А еще, у нас можно настроить шрифт и фон для комфортного чтения. Наслаждайтесь любимыми книгами в любое время и в любом месте.

Текст книги

Шрифт
Размер шрифта
-
+
Межстрочный интервал

show () подавляет вывод служебной информации на экран. В этом случае мы выводим на экран только сам график.

Рис. Настройка числа интервалов

Если задать слишком мало интервалов группировки, получается «грубая» картина с крупными «ступеньками», см. рис., слева. Слишком много интервалов дадут излишние подробности на графике – это просто случайный шум, за которым плохо просматривается форма распределения, см. рис, справа.

Рис. Подбираем число интервалов

Постепенно увеличиваем количество интервалов, пока не получим компромисс между грубыми ступеньками и случайными отклонениями.

Тут будет реклама 1
График должен получиться достаточно подробным, но не зашумлённым.

Теперь перейдём к оформлению графика, см. рис.

Настроим размеры изображения с помощью функции plt.figure (figsize= (12, 6)). Параметр figsize получает значения ширины и высоты изображения в дюймах.

Передадим дополнительные параметры функции plt. hist:

– edgecolor=’black’ – чёрные границы столбиков;

– linewidth=2 – толщина линий;

– facecolor=’white’ – заливка столбиков белым цветом;

– density=True – пересчитать результаты группировки как плотность вероятности.

Тут будет реклама 2

Теперь площадь под графиком равна единице, и нашу гистограмму можно будет сравнивать с теоретической кривой нормального распределения.

Наконец, с помощью функции plt. title мы выводим заголовок графика.

Рис. Оформление графика

2.3. Распределение

Рассчитаем теоретические значения плотности вероятности нормального распределения, см.

Тут будет реклама 3
 рис.

Загружаем функцию нормального распределения norm из модуля stat библиотеки scipy.

Далее формируем одномерный массив (вектор) из 100 чисел в диапазоне от 60 до 140. В этих пределах расположена наша гистограмма. Для этого используем функцию linspace из библиотеки numpy.

Далее вычисляем значения плотности вероятности для нормального распределения с помощью функции norm. pdf. Название pdf в данном случае расшифровывается как probability density function – функция плотности вероятности.

Тут будет реклама 4
Задаем для этой функции те же параметры, что для генератора наших исходных данных:

– loc=mu – среднее значение (математическое ожидание);

– scale=sigma – стандартное отклонение («сигма»).

Здесь параметр loc означает location, то «расположение» среднего значения, то есть математического ожидания, которое обычно обозначается греческой буквой «мю».

Параметр scale определяет «размеры», или «размах» нашей кривой.

Добавить мнение

Ваша оценка

Кликните на изображение чтобы обновить код, если он неразборчив

Мнения

Еще нет комментариев о книге Частотный анализ числовых и текстовых данных. Учебное пособие, и ваше мнение может быть первым и самым ценным! Расскажите о своих впечатлениях, поделитесь мыслями и отзывами. Ваш отзыв поможет другим читателям сделать правильный выбор. Не стесняйтесь делиться своим мнением!

Другие книги автора

Понравилась эта книга? Познакомьтесь с другими произведениями автора Валентин Юльевич Арьков! В этом разделе мы собрали для вас другие книги, написанные вашим любимым писателем.

Похожие книги