Остання обкладинка Nature: штучний інтелект переміг чемпіона світу серед людей і встановив рекорд із найшвидших перегонів на дронах

Автор: Янь Імі, редактор: Сюе Цзюнь

Штучний інтелект (ШІ) знову переміг людського чемпіона.

Цього разу це у сфері гонок безпілотників.

Команда доктора Елії Кауфманн з групи робототехніки та сприйняття Цюрихського університету та її команда Intel спільно розробили систему автономного водіння – Swift, яка має здатність керувати безпілотними літальними літальними апаратами за один раз Перемагати супротивника-людину за один... один матч чемпіонату.

Цей важливий результат дослідження щойно був опублікований в останньому номері журналу Nature у вигляді статті на обкладинці.

Малюнок | Обкладинка останнього номера Nature. (Джерело: Nature)

У статті новин і переглядів, опублікованій одночасно в журналі Nature, професор Гвідо де Кроон, дослідник Делфтського технологічного університету в Нідерландах, написав: «Дослідження Кауфманна та інших є великим кроком вперед для робототехніків подолати розрив у реальності. Хороший приклад. Незважаючи на те, що Swift навчається з використанням розумної комбінації методів навчання штучного інтелекту та традиційних інженерних алгоритмів, систему слід розвивати в більш реалістичному та різноманітному середовищі, щоб розкрити весь потенціал цієї технології».

Тим не менш, дослідницька група заявила, що це дослідження знаменує віху в мобільній робототехніці та машинному інтелекті та може надихнути на розгортання гібридних рішень на основі навчання в інших фізичних системах, таких як автономні наземні транспортні засоби, літаки та персональні роботи.

Інтелектуальне навчання, яке поєднує штучний інтелект та інженерні алгоритми

Наразі системи штучного інтелекту (AI), засновані на глибокому навчанні з підкріпленням, перевершили людських чемпіонів у таких іграх, як Atari, шахи, StarCraft і Gran Turismo. Однак усі ці досягнення відбуваються у віртуальному середовищі, а не в реальному світі.

Перегони на дронах є складними як для досвідчених пілотів, так і для ШІ, але це ще складніше для ШІ. Оскільки у віртуальному середовищі ресурси майже необмежені, тоді як перехід у реальний світ означає використання обмежених ресурсів. Особливо це стосується дронів, де датчики та обчислювальні пристрої, що замінюють людей-пілотів, повинні бути підняті в повітря.

Крім того, реальний світ набагато непередбачуваніший, ніж віртуальний. У той час як імітовані гоночні дрони можуть ідеально слідувати заздалегідь запрограмованим траєкторіям, одна команда одному дрону може мати кілька непередбачуваних ефектів, особливо складних для дронів, навчених за допомогою ШІ.

Традиційні наскрізні методи навчання важко перенести відображення віртуального середовища в реальний світ, існує розрив між віртуальним і реальним, і розрив реальності становить одну з головних проблем у області робототехніки.

У цьому дослідженні система Swift досягла інтелектуального навчання шляхом інтеграції технології навчання ШІ з традиційними інженерними алгоритмами. Спочатку система обробляє зображення, отримані дроном з камери, через штучну нейронну мережу, щоб точно визначити кути дверей. Потім програмне забезпечення бінокулярного зору використовується для розрахунку швидкості дрона.

Інновація системи Swift — ще одна штучна нейронна мережа, яка відображає статус дрона в командах для регулювання тяги та швидкості обертання. Використовуйте навчання з підкріпленням, щоб оптимізувати винагороди, які ви отримуєте від оточення за допомогою процесу проб і помилок у моделюванні. У цьому алгоритмі система використовує навчання з підкріпленням, а не наскрізне навчання, що дозволяє подолати розрив між реальністю та симуляцією за допомогою абстрактних понять.

Оскільки рівень абстракції кодування стану вищий, ніж у вихідного зображення, симулятори навчання з підкріпленням більше не потребують складного візуального середовища. Ця оптимізація зменшує різницю між змодельованою системою та реальною системою та збільшує швидкість моделювання, дозволяючи системі завершити навчання приблизно за 50 хвилин.

Згідно з документом, Swift складається з двох ключових модулів: політики спостереження та політики контролю. Серед них політика спостереження складається з візуального інерційного оцінювача та детектора воріт, які можуть перетворювати високовимірну візуальну та інерційну інформацію в специфічне для завдання низьковимірне кодування; політика керування представлена двошаровим перцептроном, який може приймати низькорозмірне кодування та перетворювати його на команди дронів.

Перевершити швидкість і продуктивність людей-пілотів

Траса для цього змагання була розроблена зовнішнім пілотом світового рівня FPV (перспектива від першої особи). Доріжка складається із семи квадратних воріт, розташованих на просторі 30 х 30 х 8 метрів, які утворюють коло довжиною 75 метрів.

Крім того, траса має характерні та складні маневри, зокрема Split-S тощо. Навіть у разі зіткнення, поки літак може продовжувати політ, пілот може продовжувати гонку. У разі зіткнення, коли жоден безпілотник не може завершити трек, перемагає дрон, який перебуває на більшій відстані.

Свіфт брав участь у кількох гонках із такими людьми, як Алекс Вановер (чемпіон світу з перегонів дронів 2019), Томас Бітматта (чемпіон MultiGP 2019) і Марвін Шеппер (3-кратний чемпіон Швейцарії).

Серед них Свіфт виграла 5 з 9 партій проти А. Вановера, 4 з 7 партій проти Т. Бітматта і 6 з 9 партій проти М. Шеппера.

Крім того, Свіфт втратив загалом 10 разів: 40% через зіткнення з суперниками, 40% через зіткнення з дверима та 20% через те, що літав повільніше, ніж люди-пілоти.

**Загалом Свіфт виграв більшість матчів проти кожного пілота-людини. Крім того, Свіфт встановив рекорд найшвидшого часу перегонів, перевершивши найкращий час пілота-людини А. Вановера на півсекунди. **

З аналізу даних можна побачити, що Swift швидший за всіх пілотів-людей загалом, особливо на ключових етапах, таких як зліт і аварійні повороти. Реакція Swift на зліт швидша, в середньому на 120 мілісекунд випереджає пілотів-людей. Крім того, Swift має більше прискорення, досягаючи більшої швидкості на перших воротах.

Крім того, Swift демонструє жорсткіші маневри під час крутих поворотів, можливо, тому, що він оптимізує свою траєкторію протягом більш тривалого часу. Навпаки, люди-пілоти вважають за краще планувати дії на коротші часові рамки, враховуючи щонайбільше одну позицію воріт у майбутньому.

Крім того, **Swift досяг найвищої середньої швидкості на загальній трасі, знайшов найкоротшу лінію перегонів і зумів утримати автомобіль у польоті біля межі. **У випробуваннях на час, у яких Swift порівнювали з чемпіонами серед людей, автономні дрони показали стабільніший час проходження кола з нижчим середнім значенням і дисперсією, тоді як продуктивність пілота-людини була більш індивідуальною із середнім значенням, а дисперсія вища.

Комплексний аналіз показує, що автономний безпілотний літальний апарат Swift продемонстрував відмінні результати в змаганнях: він не тільки перевершив швидкість, але й мав унікальні характеристики стратегії польоту, що дозволило йому підтримувати високий рівень продуктивності протягом змагань.

Не просто гонки безпілотників

У цьому дослідженні досліджуються автономні перегони безпілотних літальних апаратів на основі галасливих і неповних сенсорних даних із фізичного середовища, демонструючи, що автономна фізична система досягає рівня чемпіонату в гонках, іноді перевершуючи чемпіонів світу серед людей. Це підкреслює важливість досягнення роботів рівня чемпіонату світу. у популярних видах спорту та досягає важливої віхи в робототехніці та інтелекті.

Однак система в дослідженні не була навчена відновлюватися після аварії порівняно з людьми-пілотами. Це обмежує здатність системи продовжувати політ після зіткнення, тоді як людина-пілот може продовжувати гонку, незважаючи на пошкодження обладнання.

Крім того, порівняно з людьми-пілотами, система Swift менш адаптована до змін навколишнього середовища та використовує нижчу частоту оновлення камери; хоча цей метод добре працює в автономних гонках безпілотників, він непрактичний в інших реаліях. узагальнення між системами та середовищами не було повністю вивчено.

Очевидно, що досягнення Кауфмана і його команди не обмежуються сферою гонок безпілотників, і ця технологія може знайти застосування у військових застосуваннях. Крім того, їх технологія може зробити безпілотники більш плавними, швидшими та більшими, допомагаючи роботам ефективніше використовувати обмежені ресурси в таких сферах, як водіння, прибирання та перевірка.

Але для досягнення цих цілей дослідницькій групі ще потрібно вирішити багато проблем. Як зазначає Крун у своїй оглядовій статті: «Щоб перемогти людину-пілота в будь-якому середовищі перегонів, система повинна бути в змозі впоратися із зовнішніми перешкодами, такими як вітер, мінливі умови освітлення, погано визначені ворота, людина та машина та багато інших. інші фактори».

Паперове посилання

Переглянути оригінал
  • Нагородити
  • Прокоментувати
  • Поділіться
Прокоментувати
Немає коментарів