Liikumise planeerimine ja käitumisalgoritmid
Kuigi otsustusalgoritmid määravad kindlaks *millise* kõrgetasemelise eesmärgi autonoomne sõiduk peaks saavutama (nt jõudma sihtkohta, vältima takistusi, järgima sõidurada), muudavad liikumise planeerimise ja käitumisalgoritmid need eesmärgid konkreetseteks, teostatavateks radadeks ja manöövriteks dünaamilises ja keerulises keskkonnas. Selles alapeatükis käsitletakse neid kriitilisi komponente, uurides, kuidas need loovad sõidukile ohutuid, tõhusaid ja prognoositavaid trajektoore ja käitumist. Teekonna planeerimise ja käitumise üle otsustamise vastastikune mõju on autonoomsete sõidukite ohutuks kasutamiseks ülimalt oluline, kuna selleks on vaja algoritme, mis suudavad toime tulla ebakindlusega, reageerida teistele liiklejatele ja järgida liikluseeskirju.
Käitumisalgoritmid: "Mida" ja "Millal" otsustamine
Käitumisalgoritmid moodustavad kõrgema taseme otsustuskihi, mis tõlgendab sõiduki eesmärke ja tajutavat keskkonda, et valida sobiv sõidukäitumine. Need määravad *mida* sõiduk järgmisena tegema peaks ja *millal* seda tegema, näiteks otsustama sõidurada vahetada, järele anda, kiirendada või peatuda.
Põhilised käitumiskontseptsioonid
Lõplikud olekumasinad (FSM-id): klassikaline lähenemine, mille puhul sõiduki käitumist modelleeritakse diskreetsete olekute kogumina (nt 'FollowLane', 'PrepareLaneChangeLeft', 'ExecuteLaneChange', 'Yield', 'Stop', mis põhinevad turvalistel olekutingimustel (nendevahelistel eelmääratletud üleminekutel). JA juhi kavatsus on vasakpoolne sõidurada, üleminek “FollowLane'ilt” valikule “PrepareLaneChangeLeft”). FSM-id pakuvad lihtsust ja selgust, kuid võivad võidelda keeruka, kattuva või järkjärgulise käitumisega.
Hierarhilised olekumasinad: laiendage FSM-e, korraldades olekud kihtidesse, võimaldades keerukamat ja modulaarsemat käitumise esitust. Kõrgemad kihid võivad täita missiooni üldeesmärke, madalamad aga konkreetseid manöövreid.
Käitumispuud (BT-d): moodsam ja paindlikum alternatiiv mikrolainele. BT-d kasutavad puustruktuuri, mille sõlmed esindavad tingimusi, toiminguid või juhtimisvoogu (järjestusi, selektoreid). Need sobivad paremini juhtimisstsenaariumides levinud paralleelkäitumise ja keeruka otsustusloogika käsitlemiseks.
Reeglipõhised süsteemid: kasutage liiklusseadustest, heuristikast või ekspertteadmistest tuletatud reeglite komplekti „kui-tingimused-siis-toimingud”. Näiteks: “Kui tuvastatakse punane tuli JA sõiduk on pidurdusteekonnas, rakendage hädapidurdus.” Neid saab kombineerida teiste meetoditega.
Eesmärgi- ja kasulikkusepõhised lähenemisviisid: Need meetodid hindavad erinevaid võimalikke käitumisviise, lähtudes nende soovitavusest (kasulikkusest) üldise eesmärgi saavutamisel, võttes samal ajal arvesse piiranguid, nagu ohutus, mugavus ja tõhusus. Nad saavad valida käitumise, mis maksimeerib määratletud eesmärgifunktsiooni.
Tugevõpe (käitumise jaoks): Sarnaselt selle kasutamisega kontrollis saab RL-i rakendada käitumispoliitika õppimiseks. Agent õpib valima toiminguid (käitumisi), mis maksimeerivad tasu signaali, tuginedes interaktsioonidele simuleeritud või reaalse keskkonnaga. See võib potentsiaalselt avastada keerulisi inimsarnaseid käitumisviise, kuid seisab silmitsi sarnaste väljakutsetega seoses ohutustagatiste ja tõlgendatavusega.
Käitumisalgoritmide ohutusaspektid
Reeglite järgimine: algoritmid peavad tagama liiklusseaduste ja -eeskirjade järgimise (nt punase tule ees peatumine, eesõiguse andmine, kiiruspiirangud).
Ettenähtavus: käitumine peaks olema teistele liiklejatele etteaimatav, suurendades koostöövalmidust ja vähendades segadust.
Järjepidevus: sõiduk peaks sarnastele olukordadele järjekindlalt reageerima, suurendades usaldust ja prognoositavust.
Ebakindlus kuni ebakindlus: algoritmid peavad käsitlema tajumise ebakindlust (nt ummistunud objektid, anduri müra) ja ennustama teiste mõjurite käitumist (nt ennustama, kas jalakäija ületab).
Eetilised kaalutlused: vältimatute konfliktide stsenaariumide korral võivad käitumisalgoritmid kaudselt või otseselt arvestada eetiliste prioriteetidega, kuigi nende vormistamine on märkimisväärne väljakutse.
Väljakutsed
Sõidustsenaariumide keerukus: reaalses maailmas sõitmine hõlmab keerulisi sotsiaalseid suhtlusi, ebaselgeid olukordi ja ootamatuid sündmusi, mida on raske lihtsate reeglite või olekutega tabada.
Ebakindluse ja ennustuste käsitlemine: teiste dünaamiliste tegurite (jalakäijad, jalgratturid, muud sõidukid) kavatsuste ja tulevaste teede täpne ennustamine on kurikuulsalt keeruline ja ohutu suhtlemise jaoks ülioluline.
Skaleeritavus: Kuna võimalike käitumisviiside ja keskkonnategurite arv suureneb, suureneb käitumisloogika keerukus oluliselt.
Inimeselaadne käitumine: Inimjuhtide nüansirikka, mõnikord ebatäiusliku, kuid üldiselt ohutu ja koostööaldis käitumise tabamine on endiselt väljakutse.
Liikumise planeerimine: "Kuidas" ja "Kus" otsustamine
Kui käitumuslik otsus on tehtud (nt “vaheta rada vasakule”), vastutab liikumisplaneerija konkreetse, teostatava ja ohutu trajektoori loomise eest, mis seda käitumist teostab. See vastab küsimusele *kuidas* liikuda praegusest olekust soovitud olekusse keskkonna ja sõiduki enda piirangute raames.
Liikumise planeerimise võtmetehnikad
Võrgustikupõhised meetodid (nt A*, D*, D* Lite): Diskretiseerige keskkond ruudustikuks. Algoritmid nagu A* otsivad lühimat teed algusest eesmärgini, vältides samas takistusi, mis on kujutatud hõivatud ruudustiku lahtritena. Sellised variandid nagu D* saavad kaardi muutumisel tõhusalt ümber planeerida. Need on arvutuslikult tõhusad, kuid võivad olla ebatäpsed, kui ruudustiku eraldusvõime on liiga jäme või kui sõiduki jalajälg on ruudustiku suhtes suur.
Samplivõtmisel põhinevad meetodid (nt RRT, RRT*, PRM): need on eriti populaarsed suuremõõtmeliste sõidukite olekuruumide puhul (asend, orientatsioon, kiirus). Nad valivad olekuruumis juhuslikult konfiguratsioone ja ühendavad need, kui need on kokkupõrkevabad, koostades järk-järgult teekaardi (PRM) või kiiresti uuriva juhusliku puu (RRT). RRT* eesmärk on leida asümptootiliselt optimaalsed teed. Need meetodid sobivad hästi keerukate geomeetriate ja suurte mõõtmetega, kuid võivad olla tundlikud proovivõtu tiheduse suhtes ja võivad vajada ümberplaneerimist.
Optimeerimisel põhinevad meetodid (nt mudeli ennustav juhtimine – MPC, trajektoori optimeerimine): Sõnastage teeotsingu probleem optimeerimisülesandena. Määratlege piirangutega (kokkupõrke vältimine, kinemaatilised/dünaamilised piirid, sujuvus) objektiivne funktsioon (nt minimeerida aega, kaugust, tõmblust, kontrolli jõupingutusi). MPC lahendab selle optimeerimisprobleemi igal ajaetapil piiratud ennustushorisondi ulatuses, muutes selle sobivaks reaalajas juhtimiseks ja liikuvate takistuste käsitlemiseks. Need meetodid võivad luua sujuvaid ja kvaliteetseid trajektoore, kuid võivad olla arvutusmahukad.
Võimalikud väljameetodid: kohelge eesmärki kui ligitõmbavat jõudu ja takistusi kui tõukejõudu. Sõiduk navigeerib tulenevat jõuvälja järgides. Lihtne ja intuitiivne, kuid võib kannatada kohalike miinimumide käes (kinni jääda) ja tekitada tõmblevaid trajektoore.
Võrepõhine planeerimine: eelarvutage graafik (võre) teostatavatest teedest või “primitiividest”, mida sõiduk saab oma kinodünaamiliste piirangute alusel täita. Planeerimine hõlmab seejärel selle eelarvutatud võre otsimist primitiivide jada jaoks, mis ühendab algust eesmärgiga. See võib olla tõhus, kuid võib piirata planeerija paindlikkust.
Liikumise planeerimise ohutusaspektid
Kokkupõrke vältimine: esmane ohutuseesmärk on tagada, et loodud trajektoor ei põhjustaks kokkupõrkeid staatiliste või dünaamiliste takistustega, sealhulgas ohutu puhvri vahemaa.
Teostatavus: Trajektoor peab olema sõidukile füüsiliselt teostatav, järgides selle kinemaatilisi (rool, pöörderaadius) ja dünaamilisi (kiirendus, aeglustus, kiirus) piiranguid.
Sujuvus ja mugavus: Trajektoorid peaksid olema siledad, et tagada reisijate mugavus ja vähendada sõiduki kulumist. See hõlmab sageli tõmblemise (kiirenduse muutumise kiiruse) minimeerimist.
Prognoositavus: Planeeritud tee peaks olema etteaimatav nii autonoomse sõiduki enda jaoks (säilitades järjepidevuse) kui ka teistele seda jälgivatele liiklejatele.
Reaktiivsus ja ümberplaneerimine: Planeerija peab suutma kiiresti reageerida muutustele keskkonnas (nt uue takistuse ilmnemisele) ja planeerima reaalajas ümber ohutu trajektoori.
Väljakutsed
Arvutuslik keerukus: optimaalsete või isegi teostatavate teede leidmine reaalajas keerukate piirangutega suuremõõtmelistes olekuruumides on arvutuslikult nõudlik.
Taju ebakindlus: liikumise planeerimine sõltub suuresti täpsest ja ajakohast tajumisest. Vead või viivitused tajumisel võivad viia ebaturvaliste plaanideni.
Dünaamilised keskkonnad: Planeerimisel tuleb arvestada teiste agentide liikumist, mis nõuab prognoosimist ja sageli sagedast ümberplaneerimist.
Eesmärkide tasakaalustamine: planeerijad peavad tasakaalustama potentsiaalselt vastuolulisi eesmärke, nagu ohutus, tõhusus (aeg/kaugus), mugavus ja liiklusreeglite järgimine.
Üldistamine: Planeerija peaks hästi toimima erinevates keskkondades ja liiklusstsenaariumides, mitte ainult nendes, mille jaoks see on loodud.
Integratsioon ja interaktsioon
Käitumisalgoritmid ja liikumisplaneerijad on sügavalt läbi põimunud ja töötavad pidevas ahelas:
Taju: sõiduk tunnetab oma keskkonda.
Otsuste tegemise/käitumise kiht: analüüsib keskkonda ja praeguseid eesmärke, et valida kõrgetasemeline käitumine (nt “valmistuge vasakpoolseks sõidurea vahetamiseks”).
Liikumise planeerimise kiht: kasutab teostatava, turvalise ja sujuva trajektoori loomiseks hetkeolekut, sihtkäitumise eesmärgi olekut (nt asukoht vasakpoolsel rajal) ja tajutavat keskkonda.
Juhtkiht: järgib loodud trajektoori (või sellel olevaid võrdluspunkte) ja annab sõiduki täiturmehhanismidele (rool, gaasihoob, pidur) käsu seda järgida.
Jälgimine ja ümberplaneerimine: süsteem jälgib pidevalt täitmist, taju värskendusi ja mis tahes kõrvalekaldeid, mis võivad käivitada ümberplaneerimise kas käitumise või liikumise planeerimise tasandil.
See tihe sidumine on hädavajalik. Käitumuslik kiht annab “kavatsuse”, liikumisplaneerija aga “täitmisplaani”. Ühe kihi rike või piirang võib ohustada teise kihi ohutust ja tõhusust. Näiteks võib liiga agressiivne käitumuslik otsus panna liikumisplaneerija looma ebaturvalise trajektoori, samas kui liiga konservatiivne liikumisplaneerija võib takistada käitumusliku kihi edenemist.
Ohutuskaalutlused ja edaspidised juhised
Planeerimis- ja käitumuslike komponentide ohutuse tagamine on ülimalt tähtis ja esitab ainulaadseid väljakutseid:
Kinnitamine ja kinnitamine (V&V): Planeerijate ja käitumisalgoritmide range testimine paljudes stsenaariumides (sh äärmuslikud juhtumid ja haruldased sündmused) on kriitiline, kuid äärmiselt keeruline. Simulatsioon on võtmetähtsusega, kuid pidev väljakutse on tagada, et see hõlmaks kõiki asjakohaseid reaalmaailma võimalusi.
Käitlemise ebakindlus: tuleb selgesõnaliselt käsitleda nii tajumise ebakindlust kui ka teiste liiklejate loomupärast ettearvamatust. See hõlmab tugevaid planeerimistehnikaid, usalduspiiridega ennustusmudeleid ja potentsiaalselt konservatiivset varukäitumist.
Eetilised ja sotsiaalsed kaalutlused: käitumisalgoritmide tehtud valikutel (nt kellele alluda, kui enesekindel olla) on sotsiaalsed ja eetilised mõõtmed, mis vajavad hoolikat kaalumist ja potentsiaalselt sidusrühmade panust.
Seletatavus: Mõistmine, *miks* autonoomne sõiduk valis konkreetse käitumise või kavandas konkreetse tee, on oluline silumiseks, usalduseks ja potentsiaalselt inimestega suhtlemiseks.
Tulevikutrendid: Teadusuuringud liiguvad integreeritumate, õppimispõhiste lähenemisviiside poole, mille puhul tehisintellekti mudelid võivad andmete põhjal õppida samaaegselt nii käitumispoliitikat kui ka liikumise planeerimise strateegiaid. Samuti keskendutakse mitme agendi planeerimisele, kus sõiduk modelleerib selgesõnaliselt ja koordineerib teiste keskkonna agentidega. Ohutuse tagamine nendes keerukamates ja vähem läbipaistvamates süsteemides on jätkuvalt põhirõhk.
Järeldus
Liikumise planeerimine ja käitumisalgoritmid on intelligentne tuum, mis juhib autonoomseid sõidukeid läbi reaalse maailma keerukuse. Käitumisalgoritmid otsustavad eesmärkide ja keskkonna põhjal sobivad kõrgetasemelised toimingud, samas kui liikumisplaneerijad loovad nende toimingute tegemiseks täpsed, ohutud ja teostatavad teed. Mõlemad seisavad silmitsi oluliste väljakutsetega, mis on seotud keerukuse, ebakindluse, arvutusnõuete ja ohutuse tagamisega. Nende algoritmide edukas integreerimine ja pidev täiustamine, mida toetab range testimine ja valideerimine, on olulised sammud autonoomsete sõidukite usaldusväärseks tööks ja laialdaseks kasutuselevõtuks vajaliku kõrge ohutustaseme saavutamiseks. Nende areng on ka edaspidi kriitilise tähtsusega liikumapanev ohutu autonoomne liikuvus.
—
Juhtumiuuring ja ohutusargumentatsioon
TalTech iseAuto süstiku puhul on digitaalne kaksik (sõidukimudel, andurite komplekt ja ülikoolilinnaku keskkond) integreeritud LGSVL/Autoware'iga läbi ROS-silla, nii et fotonid-pöördemomendi silmuseid teostatakse enne mis tahes rajakatset realistlike stseenide all. Stsenaariumid levitatakse ülikoolilinnaku xodr võrgus, kasutades Scenic/M-SDL; stsenaariumi sisse saab aheldada mitu sündmust, et uurida planeerija käitumist pargitud sõidukite, aeglaste või vastutulevate sõidukite ümber. Logimine on joondatud ülaltoodud KPI-dega, nii et tulemused on LF/HF kihtide lõikes võrreldavad ja planeerija- või juhtimisparameetrite muutumisel uuesti käivitatavad.
Praktikas on see andnud kokkuvõtliku ja kaitstava narratiivi ohutuse planeerimiseks ja kontrollimiseks: (1) mida testiti (formaliseeritud stsenaariumid struktureeritud parameetriruumis); (2) kuidas seda testiti (kahekihiline simulatsioon kalibreeritud digitaalse kaksikuga ja vajadusel raja täitmine); (3) mis juhtus (missiooni õnnestumine, DTC miinimumid, TTC profiilid, pidurdamise/juhtimise siirded, lokaliseerimise triiv); ja (4) miks see on oluline (tõendid selle kohta, et häälestamine või algoritmilised muudatused viivad otsuse-täitmise ahelat ohutuse suunas või sellest eemale). Sama raamistikku on kasutatud reeglipõhiste kohalike planeerijate vastasseisu analüüsimiseks, kinnitades, et planeerimise valideerimine peab hõlmama jaotusmuutuste ja sihipäraste häirete suhtes vastupidavust.
Lõpetuseks tunnistab lähenemine, et simulatsioon ei ole maailm – seega mõõdab see lõhet. Formaalselt genereeritud juhtumite rajale transportimisel ja aegridade käitumise võrdlemisel kinnitab programm nii planeerimis-/juhtimisloogikat kui ka kalibreerib digitaalse kaksiku enda, kasutades lahknevusi mudelivärskenduste ja ODD-piirangute suunamiseks. See on kaasaegse juhtimise ja planeerimise V&V tunnus: stsenaariumipõhine, digitaalselt põimitud, formaalselt maandatud ja reaalsusega järeleandmatult võrreldav.