Autonome biler

Utdaterte datasett for selvkjørende biler vitner om utviklingen av maskinlæring

Utdaterte datasett for selvkjørende biler vitner om utviklingen av maskinlæring



We are searching data for your request:

Forums and discussions:
Manuals and reference books:
Data from registers:
Wait the end of the search in all databases.
Upon completion, a link will appear to access the found materials.

Når selvkjørende biler blir en realitet på offentlige veier, må all data og informasjon som er ansvarlig for å kjøre dem trygt være på ballen.

Dette var grunnen til at bekymring var den viktigste reaksjonen da det spredte seg ord om at etiketter til hundrevis av fotgjengere, syklister, trafikkegler manglet fra et mye brukt datasett for selvkjørende biler. Når alt kommer til alt, tar ikke "veireglene" hensyn til selvkjørende biler med blinde flekker som inkluderer mennesker.

Men dette er faktisk ikke tilfelle.

SE OGSÅ: HVORDAN FUNGER SELVKJØRENDE BILER?

Maskinlæring utvikler seg, viser gamle datasett

Ut av det 15,000 håndkontrollerte bilder fra Udacity Dataset 2, 4,986 av dem, det er 33%, var ufullstendige, ifølge kommersiell datasettleverandør, Roboflow.ai. Men Udacitys datasett ble opprettet for mer enn tre år siden, og er ikke aktive på offentlige gater.

Det er viktig å huske: i internettårene med maskinlæring er tre menneskeår flere liv siden.

"I de mellomliggende årene," sa Udacity til Interesting Engineering (IE) i en e-postutveksling, "selskaper som Waymo, nuTonomy og Voyage har publisert nyere, bedre datasett beregnet på virkelige scenarier."

Med andre ord, Udacity har ikke aktivt opprettet nye datasett for å holde tritt med den nyeste linjen med selvkjørende bildatasett fordi det - for nå - har gitt den virkelige verden av offentlige gater til nyere selskaper.

Maskinlæring og algoritmer

Maskinlæring har hjulpet mange bransjer å utvikle seg utover deres nåværende tilstand. Å lære datamaskinalgoritmer til å utføre nye oppgaver er nødvendig for at denne prosessen skal fungere greit og trygt. På en lang tidslinje blir disse datasettene enormt komplekse. Dette kan gjøre dem vanskelige for folk i starten av sin selvkjørende bilkarriere å forstå. Derfor er ufullstendige datasett - som en "enkel modus" i et videospill - ikke en dårlig idé. Så lenge de holder seg utenfor veien.

Selvkjørende biler krever mye data for algoritmene for å navigere i farene ved offentlige gater. Hvis en bil ikke vet hvordan man skal kjenne igjen en menneskelig fotgjenger som går ved siden av veien, eller en syklist som deler veien med bilen, kan det oppstå alvorlige problemer.

Den kommersielle datasettleverandøren, Roboflow, publiserte en artikkel som bekreftet at et populært selvkjørende bildatasett virkelig mangler oppdateringer. Udacity Dataset 2 brukes av tusenvis av studenter som bygger et open-source selvkjørende bildatasett.

Selskapet Roboflow håndsjekket 15 000 bilder fra datasettet, og oppdaget det 33% av dem hadde problemer. Det var tusenvis av umerkede kjøretøy, hundrevis av umerkede fotgjengere, og dusinvis av umerkede syklister.

Treningshjul for selvkjørende bildatasett

Roboflow har kanskje ikke hatt noen intensjon om å villede publikum. Konseptet med treningshjul er vanskelig å forstå for alle. Er en sykkel fremdeles en sykkel, hvis jenta som kjører den har to ekstra hjul? Slags, men ikke akkurat. Opplever hun hvordan det er å sykle? Definitivt, men uten den virkelige risikoen for potensielt å falle.

Er hun klar for den virkelige tingen?

Det er opp til henne, og det samme kan sies om studentene, som må bestemme om de er klare til å ta av treningshjulene, og bygge sine egne datasett i den virkelige risikoen i bransjen.

Selvfølgelig, med utgangspunkt i Udacitys datasett, vil disse studentene ha en lang vei å gå. Manglende identifikasjon sporet av Roboflow inkluderte dupliserte avgrensningsbokser, store avgrensningsbokser og fantomkommentarer.

For å gjøre saken komplisert, rundt 1.4% av bildene var rett og slett lite aktivert, men de inneholdt biler, lastebiler, lys og til og med fotgjengere - som en invitasjon til morgendagens datasettutviklere, for å fylle ut dataene for seg selv.

Dette viser hvor utrolig komplekse datasett med åpen kildekode er, og dette avviket mellom virkelige veier og tidlige datasett er en kreditt til de banebrytende dataselskapene med kjøretøy på offentlig vei. Men Udacitys selvkjørende bilsett er ikke i bruk på offentlige veier. For tiden er Udacitys eneste selvkjørende bil kun til utdanning, satt opp på et lukket testspor.

Studenter som trenger et jukseark - i deres ambisjon om å fylle ut hullene i et tre år gammelt datasett - har flaks: Roboflow fikset og utgav datasettet her.

Ettersom maskinlæring presser selvkjørende bilteknologi for å lage datasett med høyere troverdighet, blir det lettere å se tilbake på årene og tiårene, og lure på hvordan vi klarte det.

Men akkurat som jenta og sykkelen hennes - utfordringen ligger i å fjerne treningshjulene og å gjøre sin egen vei på offentlige veier.

*** Redaktørens merknad: Denne artikkelen er oppdatert - med flere endringer gjort gjennomgående - etter å ha mottatt klarhet fra Udacity. En tidligere versjon av denne artikkelen antydet at Udacitys selvkjørende bil datasett var i aktiv bruk på offentlige gater. Dette er blitt korrigert for å gjenspeile det faktum at selskapets data bare brukes til pedagogiske formål, og faktisk ikke er mer feil enn "treningshjul", og bare brukes til å hjelpe utviklere av ambisiøse datasett å bli mer kjent med teknologien. I tillegg har Udacity ikke utviklet nye datasett på tre år, og har "gitt ordet" til nyere, mer avanserte datasett levert av andre, ikke tilknyttede selskaper. I tillegg er Udacitys eneste selvkjørende bil i drift utelukkende for pedagogiske formål, og opererer på en lukket testbane, ikke offentlige gater. Alt i alt antydet den tidligere versjonen av denne artikkelen at ufullstendige datasett utviklet av Udacity var feil, noe som er en misforståelse av det faktum at gamle datasett naturlig ser ut til å være feil, i ettertid av fremtidig utvikling. Til slutt er den originale tittelen på denne artikkelen endret for å gjenspeile dette. IE angrer på disse feilene.

-IE Redaksjonell ***


Se videoen: SE LIVE: Selvkjørende buss i Oslo (August 2022).