ШІ-щур навчається втекти від кота
Щур знаходиться в центрі ставка, тоді як кіт чекає на краю, щоб його зловити.
Ситуація здається безвихідною — чи зможе ШІ знайти стратегію втечі?
Задача про втечу щура від кота
Ця доповідь присвячена математичній задачі, у якій щур опинився в центрі круглого ставка, тоді як кіт чекає на краю, щоб його спіймати. Я покажу кілька способів втечі, заснованих на геометричних міркуваннях, а також покажу, як ШІ-щур може навчитися тікати від кота за допомогою глибинного навчання з підкріпленням.
Щоб правильно розглянути комп’ютерні симуляції, це відео бажано дивитися на великому екрані, наприклад на ноутбуці або планшеті.
Різні мовні версії
Текст цієї презентації зараз подано англійською мовою, але озвучення виконується штучним інтелектом, якого я навчив використовувати мій голос і перекладати мою промову іншими мовами. Різні мови озвучення можна вибрати за допомогою випадаючого меню вибору мови.
Цей ШІ дуже добре відтворює мій голос англійською мовою, хоча, як мені повідомили, в деяких інших мовах результат дещо гірший.
Зміст
- Початкова задача — гра «Кіт і миша» від Numberphile
- Скрутне становище Влада: тактики ривка, кружляння та втечі
- Стратегія втечі професора Щура: «кружляння і ривок»
- Покращена стратегія втечі
- ШІ-щур — що таке глибинне навчання з підкріпленням?
- Чи може ШІ-щур навчитися тікати від кота?
- Підсумок і висновки
Гра «Кіт і миша» від Numberphile
Ця задача заснована на прикладі з відео популяризаторського математичного каналу Numberphile, представленого Беном Спарксом у 2019 році:
Numberphile: Game of Cat and Mouse
У своєму відео вони показують тактики ривка та кружляння, а також демонструють, як їх можна поєднати, щоб знайти рішення за допомогою геометричних міркувань. Я покажу ці тактики і поясню, як працює їхнє рішення. Я також представлю новий підхід, який назву тактикою втечі. Нарешті, я покажу, як просту варіацію цього рішення можна оптимізувати за допомогою генетичного алгоритму.
Борис, Влад і професор Щур
У задачі Numberphile фігурують кіт і миша, але в моїй версії головними персонажами є кіт і щур. Для початкових спроб втечі, що використовують тактики ривка і кружляння, я назвав двох учасників Борисом-Котом і Володимиром-Щуром.
Малий Володимир не має жодного розуміння стратегії, тактики чи геометрії, тому він приречений. Після його загибелі його замінює професор Щур для більш складних спроб втечі.
Чи може ШІ-щур утекти від кота?
Я покажу, як ШІ-щур може навчитися тікати від кота за допомогою глибинного навчання з підкріпленням. Ми побачимо, що ШІ-щур швидко розробляє стратегію, яка включає складні маневри втечі і постійно приводить до успіху.
Тип штучного інтелекту, здатний вирішувати подібні задачі, має безпосереднє значення для військових роботизованих систем.
Війна в Україні
Поточна війна в Україні після повномасштабного вторгнення Росії у 2022 році призвела до широкого й дедалі більшого використання автономних і напівавтономних систем обома сторонами. Також спостерігається зростання використання штучного інтелекту в цих системах.
Ймовірно, що такі автономні системи незабаром почнуть безпосередньо взаємодіяти одна з одною у бойових умовах.
Тип ШІ, показаний у цій доповіді, здатний самостійно навчитися взаємодіяти з противником, використовуючи знання про його поведінку. У цій задачі метою ШІ було втекти від противника, але так само метою могло бути його знищення.
За наявності реалістичного середовища навчання описані тут алгоритми та методи штучного інтелекту цілком здатні розвивати подібні можливості. Тому значення цієї технології в нинішній ситуації є очевидним.