Новый метод улучшения обучаемости роботов, выполняющих повторяющиеся задачи

5 июня 2023 г.

Эта статья была проверена в соответствии с редакционным процессом и политикой Science X. Редакторы выделили следующие атрибуты, гарантируя при этом достоверность контента:

проверенный фактами

корректура

от Кактус Коммуникейшнз

Учиться на прошлых ошибках могут не только люди. Компьютеры тоже это делают. В промышленности это делается с помощью компьютерных систем управления, которые помогают управлять производственными системами. Для промышленных роботов, которые выполняют определенные задачи партиями, например, производят одежду, компьютерные чипы или хлебобулочные изделия, наиболее часто используемым методом управления является итеративное управление обучением (ILC). Большинство отраслей по-прежнему полагаются на системы ILC, использующие стратегию обучения, называемую правилом обновления пропорционального типа (PTUR). Этот метод повышает производительность систем ILC за счет многократного повторения одной и той же задачи и обновления управляющих входных данных на основе ошибок, обнаруженных на предыдущих итерациях.

Однако эта методология контроля была предложена десятилетия назад. А поскольку системы ILC все чаще применяются для выполнения более сложных задач, существует потребность в методах, которые могут обучаться быстрее и с большей точностью.

В ходе недавнего прорыва группа ученых предложила новую методику, которая использует правило обновления дробной мощности (FPUR) для повышения потенциала производительности линейных систем ILC с одним входом и одним выходом. Исследование было опубликовано в журнале IEEE/CAA Journal of Automatica Sinica.

Скорость конвергенции — скорость, с которой разница между желаемым и фактическим выпуском уменьшается с течением времени — играет решающую роль в определении эффективности системы ILC. Существующие методы улучшения скорости сходимости часто оказываются неудовлетворительными в ситуациях, требующих высокой точности. Даже в случае постоянного или вручную выбранного выигрыша от обучения современные системы ILC, использующие метод линейного обновления, не могут в полной мере использовать доступную информацию. Поэтому ученые исследовали подходы, выходящие за рамки PTUR, которые использовали методы нелинейного обновления для обучения и достижения желаемого результата.

«Традиционный PTUR использует линейный термин для ошибки отслеживания для обновления управляющего входа. С другой стороны, FPUR использует дробный термин для обновления. Поскольку любое положительное число, меньшее единицы, имеет большую дробную степень, чем оно само, интенсивность обновления FPUR больше, чем у PTUR для небольших ошибок отслеживания, что приводит к более высокой скорости сходимости», — объясняет Цзихань Ли, ведущий автор исследования и магистрант Школы математики Китайского университета Жэньминь.

Команда разработала новый метод FPUR, вдохновленный новыми стратегиями управления за конечное время (FTC) и терминальным скользящим режимом управления (TSMC), которые являются потенциальными методами преодоления ранее упомянутых проблем и повышения скорости сходимости. Ученые также применили подход нелинейного картирования для изучения динамики ошибок с течением времени. Этот подход позволил им сообщить о высокой производительности конвергенции и охарактеризовать возможные предельные циклы отслеживания ошибок в системах ILC. Кроме того, было проведено численное моделирование для проверки эффективности нового метода.

Блог

Новый метод улучшения обучаемости роботов, выполняющих повторяющиеся задачи