Категорії курсів

Детальніше про курс

Внимание: для доступа к курсам ITtensive на Udemy напишите, пожалуйста, на [email protected] с названием курса или группы курсов, которые хотите пройти.Это завершающий курс программы Машинное обучение от ITtensive., В этом курсе мы разберем 3 задачи обучения с подкреплением:1. Игра в крестики-нолики на доске 3x3. Запрограммируем среду, условия выигрыша и обучим простых и не очень агентов (игроков) сводить игру к ничье. На примере базовых стратегий рассмотрим работу уравнения Беллмана, Q-обучения и обучения с преследованием.Используя различные стратегии, включая эпсилон жадные и оптимизированные эпсилон жадные, сравним их эффективность при игре друг с другом.Проект: разработка собственного выигрышного агента для игры в крестики-нолики.2. Задача балансировка тележки в физическом окружении. Используем CartPole AI Gym и научимся балансировать тележку в зависимости от данных сенсоров. Изучим принципы построения нейросети обучения с подкреплением (DQN = Deep Q-Network) и используем ее для ускорения и стабилизации процесса обучения.Сравним обучение агента на случайных процессах, на изучении распределения состояний среды (априорные и постериорные вероятности), на эмуляции кратковременной и долговременной памяти агента, разберем проблемы обучения и оптимизации полносвязной нейросети.Проект: разработка оптимизированной DQN для балансировки тележки.3. Игра в блекджек (21 очко). Используем окружение AI Gym для расчета оптимальных ходов при игре в Блекджек. Используем методы Монте-Карло, включая одиночные и множественные касания, единую и разделенную политики, а также оптимизацию исследовательских стартов.Визуализируем оптимальную политику поведения агента через изоповерхности в пространстве состояний среды.Проект: расчет оптимальной стратегии игры в блекджек.
Сертифікат
Занять 42
Годин 5
Періодичність індивідуальний графік
Тип навчання online
Трансляція Відеозапис
Вступний іспит
Перевірка домашнього завдання
Дипломний проект
Допомога в працевлаштуванні
Вікова категорія для дорослих
Рівень підготовки Початковий
Мова Русский

Чого ви навчитеся на цьому курсі?

  • Машинное обучение с подкреплением
  • Среда, агент, действия и вознаграждения
  • Случайная стратегия и методы Монте-Карло
  • Уравнение Беллмана
  • Q-таблица и Q-обучение
  • Эпсилон-жадные стратегии
  • UCB и стратегия Томпсона
  • Deep Q-Network
Детальніше про програму курса

Для кого курс?

Аналитики Python, изучающие машинное обучение

Фінансові умови

Гарантия возврата денег — 30 дней

Додаткова інформація про курс

5,5 видео по запросу Полный пожизненный доступ Доступ через мобильные устройства и телевизор Сертификат об окончании

Про компанію Udemy

Мы делимся знаниями с миром

Улучшение жизни через обучение

Если вы хотите узнать или поделиться тем, что вы знаете, вы попали в нужное место. Являясь глобальным центром онлайн-обучения, мы объединяем людей с помощью знаний.

Мы помогаем организациям всех типов и размеров подготовиться к предстоящему пути — куда бы он ни привел. Наша подборка бизнес-курсов и технических курсов помогает компаниям, правительствам и некоммерческим организациям идти дальше, ставя обучение в центр своих стратегий.

На сайт курсу
Udemy

Мы делимся знаниями с миром

Улучшение жизни через обучение

Если вы хотите узнать или поделиться тем, что вы знаете, вы попали в нужное место. Являясь глобальным центром онлайн-обучения, мы объединяем людей с помощью знаний.

Мы помогаем организациям всех типов и размеров подготовиться к предстоящему пути — куда бы он ни привел. Наша подборка бизнес-курсов и технических курсов помогает компаниям, правительствам и некоммерческим организациям идти дальше, ставя обучение в центр своих стратегий.

Детальніше про школу