На нашем сайте вы можете читать онлайн «Искусственный интеллект. Машинное обучение». Эта электронная книга доступна бесплатно и представляет собой целую полную версию без сокращений. Кроме того, доступна возможность слушать аудиокнигу, скачать её через торрент в формате fb2 или ознакомиться с кратким содержанием. Жанр книги — Знания и навыки, Компьютерная литература, Программирование. Кроме того, ниже доступно описание произведения, предисловие и отзывы читателей. Регулярные обновления библиотеки и улучшения функционала делают наше сообщество идеальным местом для любителей книг.
Искусственный интеллект. Машинное обучение

Автор
Дата выхода
19 марта 2024
Краткое содержание книги Искусственный интеллект. Машинное обучение, аннотация автора и описание
Прежде чем читать книгу целиком, ознакомьтесь с предисловием, аннотацией, описанием или кратким содержанием к произведению Искусственный интеллект. Машинное обучение. Предисловие указано в том виде, в котором его написал автор (Джейд Картер) в своем труде. Если нужная информация отсутствует, оставьте комментарий, и мы постараемся найти её для вас. Обратите внимание: Читатели могут делиться своими отзывами и обсуждениями, что поможет вам глубже понять книгу. Не забудьте и вы оставить свое впечатие о книге в комментариях внизу страницы.
Описание книги
Исследуйте мир машинного обучения с этой книгой, предназначенной для тех, кто стремится погрузиться в фундаментальные принципы и передовые методы этой динамично развивающейся области. От введения в основные концепции до глубокого погружения в продвинутые техники и приложения, каждая глава представляет собой комплексное исследование, подкрепленное практическими примерами и советами. Будучи ориентиром как для начинающих, так и для опытных практиков, данная книга поможет вам освоить ключевые навыки, необходимые для эффективного применения методов машинного обучения в реальных задачах.
Искусственный интеллект. Машинное обучение читать онлайн полную книгу - весь текст целиком бесплатно
Перед вами текст книги, разбитый на страницы для удобства чтения. Благодаря системе сохранения последней прочитанной страницы, вы можете бесплатно читать онлайн книгу Искусственный интеллект. Машинное обучение без необходимости искать место, на котором остановились. А еще, у нас можно настроить шрифт и фон для комфортного чтения. Наслаждайтесь любимыми книгами в любое время и в любом месте.
Текст книги
Таким образом, метод Q-обучения позволяет агенту научиться выбирать оптимальные действия в зависимости от текущего состояния среды, минимизируя количество шагов до достижения цели.
Динамическое программирование
Динамическое программирование (DP) в обучении с подкреплением (RL) – это метод, используемый для решения задач, в которых среда представляет собой марковский процесс принятия решений (MDP). Основная идея DP заключается в рекурсивном вычислении оптимальных значений функций ценности для каждого состояния или пары состояние-действие.
Принцип оптимальности Беллмана является основой динамического программирования в RL. Он утверждает, что оптимальные значения функций ценности удовлетворяют принципу оптимальности, то есть оптимальное значение функции ценности для каждого состояния равно максимальной сумме награды, которую агент может получить, начиная с этого состояния и действуя оптимально в дальнейшем.
В DP агент прогнозирует будущие награды, используя текущее состояние и действие, а также функцию перехода, которая определяет вероятности перехода из одного состояния в другое при выполнении определенного действия. Затем агент обновляет значения функций ценности для каждого состояния на основе полученных прогнозов, применяя операцию оптимальности Беллмана.
Одним из ключевых преимуществ динамического программирования является его эффективность при наличии модели среды, которая позволяет точно предсказывать будущие состояния и награды. Однако этот метод ограничен применением в средах с большим пространством состояний из-за высокой вычислительной сложности при хранении и обновлении значений функций ценности для каждого состояния.
Пример 1
Примером задачи, решаемой с использованием динамического программирования в обучении с подкреплением, может быть задача управления роботом на основе MDP. Представим себе робота, который находится в лабиринте и должен найти оптимальный путь к выходу, минимизируя количество шагов.
1.











