5. стимулирование, поощрение; подкрепление; мотивация # использование стимулов для достижения желаемого поведенческого отклика (например, при обучении нейронных сетей или при изменении поведения системы, объекта, субъекта) (см. также behavior, reinforcement learning, schedule of reinforcement
).reinforcement learning
(RL) – [машинное] обучение с подкреплением; стимулированное обучение, стимулированное машинное обучение, обучение по алгоритму типа “кнут и пряник” # один из видов алгоритмов обучения, широко применяемый в ИИ. Он ассоциируется с поведенческой психологией (behavior psychology); здесь испытуемая система (программный агент, RL agent) в своей среде обитания (environment) должна для достижения успеха предпринимать действия и изменять в нужном направлении поведенческие характеристики системы, чтобы обеспечить некоторый кумулятивный результат как награду (reward) (т. е. агент учится вести себя в незнакомой окружающей среде, выполняя определённые действия и наблюдая за наградами/результатами, которые он получает от этих действий. Его задача – максимизировать величину награды). Подобная проблема, ввиду своей общности, является предметом исследований во многих других дисциплинах – искусственный интеллект (artificial intelligence), теория игр (game theory), теория управления (control theory), исследование операций (operations research), теория информации (information theory), оптимизация на основе моделирования (simulation-based optimization), многоагентные системы (multi-agent system), коллективный (распределённый) интеллект (swarm intelligence), статистика (statistics) и генетические алгоритмы (genetic algorithm) и др. Принципы и методы стимулированного машинного обучения находят широкое применение в самых разных областях, от экономики до робототехники. Рост интереса к этому виду обучения начался в октябре 2015 года, когда программа AlphaGo DeepMind, обученная этим методом, победила чемпиона мира в стратегической игре Го (см. также AI technology, deep learning, machine learning, reinforcement, reward signal, robotics).reintegration
– реинтеграция # включение в работу заменённого модуля, блока, платы, устройства и т. п.relation discovery
(также relationship discovery) – обнаружение (выявление, раскрытие) отношений, связей, взаимосвязей [при аналитической обработке данных, текстов, документов] # см. также NLP, relation extraction, text analytics.relation extraction
(также relationship extraction) – извлечение отношений [из текста] # процесс (задача) нахождения в тексте семантических отношений между двумя или более элементами, объектами определённого типа (это могут быть, например, люди, организации, географические пункты и др.). Например, relation extraction methods – методы извлечения отношений (см. также named entity recognition, NLP, relation discovery, text analytics, text mining).relative coordinates
– относительные координаты # координаты, задающие положение точки относительно некоторой заданной точки.relative coordinate system
(RCS) – относительная система координат, относительная СК # в робототехнике – СК, подвижная относительно мировой СК.relative efficiency
– 1. относительная эффективность;2. относительная производительность.
relative error
– относительная ошибка; относительная погрешность.relative performance
– относительная производительность # показатель производительности аппаратных и/или программных средств, вычисленный относительно некоторого устройства, производительность которого принята за единицу.relative sensitivity
– относительная чувствительность # в измерительных приборах – отношение изменения выходного сигнала к относительному изменению измеряемой величины.