Djup förstärkt inlärning: ett steg närmare verklig AI

Djup förstärkt inlärning innebär att maskiner interagerar med sin omgivning genom att bearbeta observationer och vidta åtgärder utan vägledning från människor.

Artificiell intelligens (AI). En het tekniktrend som alla har en åsikt om – det är antingen mänsklighetens undergång eller dess hopp, det är en teknik med ”superkrafter” som alla företag vill föra in i sina produkter och lösningar.

Många produkter benämns som AI-produkter av marknadsföringsskäl, vilket skapar stor förvirring kring själva begreppet. För att reda ut saker och ting bör vi ställa oss en enkel fråga: Vad är AI?

Frågan är enkel, men inte svaret. Det finns nämligen ingen formell definition av intelligens. Vi kanske inte kommer att kunna definiera det helt och hållet, men de flesta av oss är ändå överens om att människor är intelligenta. Och det är vår förmåga att hitta lösningar på komplexa problem som får oss att tro att vi är intelligenta. En genomsnittlig människa med tillräckligt stor erfarenhet kan ta fram strategier för utmanande situationer.

Ta ett bordfotbollsspel, eller foosballspel som det också kallas, som exempel. Även om du aldrig har spelat det förut kan du så snart du förstår vad det går ut på börja spela och försöka göra mål.

I takt med att du blir mer erfaren börjar du testa olika strategier. Medan du spelar pågår komplexa processer i ditt nervsystem: du lär dig genom erfarenheter, kan förutsäga dynamiken i omgivningen och optimera ditt beteende för att nå fram till slutmålet.

Om vi kommer överens om att dessa är de viktigaste aspekterna av intelligens bör det som benämns som AI ha samma egenskaper.

Måste maskiner kunna tänka och agera på egen hand för att anses vara AI-maskiner? Ja. Och det är detta som djup förstärkt inlärning, ett särskilt område inom maskininlärning, kan leda oss fram till.

Djup förstärkt inlärning är en kombination av två maskininlärningstekniker: djup inlärning, som är välkänt inom flera områden, däribland objektigenkänning, och förstärkt inlärning, som bygger på tanken att maskiner interagerar med sin omgivning och lär sig genom att samla på sig erfarenheter i stället för att ta del av insamlade data.

Djup förstärkt inlärning innebär att maskiner interagerar med sin omgivning genom att bearbeta observationer och vidta åtgärder utan vägledning från människor.

Därigenom kan de producera data som sedan kombineras med en feedbacksignal som informerar maskinen om huruvida den presterar bra eller inte.

Om vi fortsätter med foosball-exemplet: om maskinen lyckas göra mål får den positiv feedback. Djupinlärningsdelen hjälper maskinen att identifiera mönster i de data den själv har producerat och justera sitt beteende för att kunna få mer positiv feedback i framtiden.

Djup förstärkt inlärning gör det möjligt för maskiner att hitta sina egna lösningar på komplexa uppgifter. Det enda maskinen behöver är tillgång till omgivningen och enkel feedback på sina prestationer. Det är allt – det behövs inga hårdkodade regler eller expertdata.

För att uttrycka det enkelt: Med djup förstärkt inlärning behöver du inte veta hur saker ska utföras så länge du känner till slutmålet.

Det här kan ge enorma affärsfördelar. Föreställ dig en komplex utmaning, så som ett internationellt företags hela distributionskedja eller en tillverkares produktionslinje.

I ett sådant fall önskar man sig leveranser i rätt tid, inga förseningar, hög kvalitet och låg energiförbrukning, men det är inte lätt att hitta rätt metod för att nå och balansera alla dessa mål.

Med djup förstärkt maskininlärning kan maskinerna uppnå övermänsklig kapacitet och stötta dig på ett sätt du aldrig hade kunnat föreställa dig.

Så – varför används inte djup förstärkt inlärning oftare inom företagen? Det beror delvis på att djup förstärkt inlärning tar tid. Maskiner behöver samla på sig erfarenheter för att kunna börja lära sig på egen hand. Under träningsfasen är deras beteende långt ifrån optimalt, och ingen leverantör eller tillverkare har råd med en sådan typ av kaos i sina system.

Simuleringar är ett bra sätt att komma runt det problemet. Maskinen kan lära sig det den behöver lära sig i en simulerad miljö. Det går mycket snabbare och gör ingen skada på den riktiga verksamheten. Simuleringarna måste vara mycket exakta och ligga nära verkligheten.

Om det rör sig om fordonsbranschen måste simuleringarna vara mycket lika verkliga trafikförhållanden. Om det rör sig om en distributionskedja måste man simulera hur beställningar och leveranser fungerar. Kvaliteten på resultatet beror i hög grad på kvaliteten på simuleringarna.

Nyckeln till framgångsrik djup förstärkt inlärning är därför att ta ett verkligt system, skapa exakta simuleringar av det, släppa in maskininlärningen i denna miljö och sedan föra över det inlärda beteendet till det verkliga systemet.

Ett exempel på hur djup förstärkt inlärning kan användas i verkliga system är de tester som Bosch Rexroth och DXC Technology utför med hjälp av en halvautomatiserad foosball-maskin. Foosball-maskinen har ett tydligt mål: Den måste lära sig att göra mål för att vinna mot sin motståndare, och det är det enda den belönas för.

Under processens gång utvecklar maskinen en strategi helt på egen hand, och i simuleringar lärde sig maskinen att göra mål på bara två timmar. När ytterligare sex timmar hade gått spelade den mycket bättre än någon av utvecklarna.

Maskinerna som styr spelet hanteras av automatiseringslösningar av standardtyp, som servomotorer, drivenheter och styrenheter, som används i olika industritillämpningar. Tanken är att samla på sig kunskap och kunna göra produktionslinjer mer flexibla.

Det ultimata målet är att tillverkare i framtiden inte ska behöva be programmerare att lägga till nya funktioner. De ska bara kunna berätta för maskinen vad de vill ha, och så sköter systemet resten.

Tekniken och de möjliga användningsområdena för djup förstärkt maskininlärning är spännande, men forskarna är realistiska, och det kommer att ta tid att omsätta simulerade fall i praktiken. Det finns en mängd utmaningar, och att skapa en realistisk simuleringsmiljö är bara en av dem. Men om allt går som det ska är djup förstärkt inlärning ett stort språng framåt på vägen mot verklig AI.

Läs också: Gartner förutspår framtiden för AI-teknik

Läs också: Hur artificiell intelligens kommer att göra skillnad i ditt liv

Säg din mening

*