Hur Amazon vill överbrygga datavetenskapsklyftan genom att föra maskininlärning till molnet

Företag letar allt mer efter sätt att förbättra sin kärnkraft genom att bryta de data de samlar in.

Men det är svårt för företag att utvinna meningsfull information när datavetare är bristfälliga.

Som svar på detta färdighetsbrist har stora molnleverantörer skapat on-demand-tjänster för att ge företag en chans att komma igång med maskininlärning.

Maskininlärning är en teknik som gör det möjligt för datorer att leta efter mönster i data och som driver online-rekommendationsmotorer som föreslår böcker eller filmer du kan njuta av. Företag kan använda modeller för maskininlärning för att göra användbara förutsägelser: till exempel "Är detta e-post spam?" eller "Hur många artiklar förväntas sälja i den här regionen?"

AWS-chef för datavetenskap Matt Wood Image: Amazon

Amazon, Microsoft och Google tillhandahåller on-demand maskininlärningstjänster via sina respektive molnplattformar, var och en med olika nivåer på tillgänglighet för utvecklare utan bakgrund i statistik.

Amazon har använt maskininlärning sedan dess tidiga dagar som en online-säljare av böcker, då den behövde ett sätt att hjälpa sina mänskliga redaktörer att välja rekommendationer från ett miljon starkt bibliotek.

"Vi beslutade mycket tidigt som en organisation att maskininlärning skulle bli viktigt när vår verksamhet växte, " sade Matt Wood, chef för datavetenskap vid Amazon Web Services (AWS).

"Vi hade ett beslut att fatta. Vill vi gå av och anställa en hel massa experter och specialister på maskinlärande när dessa killar och flickor är väldigt sällsynta? Det är en väldigt sällsynt blandning av färdigheter i statistik, korsvalidering, av algoritmdesign. "

Istället beslutade Amazon att anställa en relativt liten grupp maskininlärningsexperter för att bygga en intern tjänst som alla dess utvecklare kunde använda.

"Vi såg den här känslan av innovation eftersom utvecklare inte behövde spendera en hel massa tid på att lägga sig på maskininlärning för att kunna använda sina fördelar, " sade han och citerade tjänstens roll inom områden som uppfyllande, kapacitet planering, hantering av leveranskedjor och identifiering av förfalskade varor.

Den offentliga maskininlärningstjänsten som erbjuds av AWS idag är baserad på samma algoritmer som företaget ställer till sin personal internt. Kunder kan bygga maskininlärningsmodeller med data lagrade i Amazons Relational Data Service med en MySQL-backend, S3-objektlagret eller Redshift-datalagringstjänsten för att utbilda dem.

Dessa modeller kan användas för att göra olika typer av förutsägelser. Binär klassificering används för att förutsäga ett av två möjliga resultat - "Är detta e-post spam eller inte?". Multiklassklassificering för att förutse ett av tre eller flera möjliga resultat och sannolikheten för var och en - "Är den här produkten en bok, en film eller en klädartikel?". Regression används för att förutsäga ett tal - "Vad är temperaturen sannolikt i morgon?".

Tjänsten försöker också automatiskt validera data och om möjligt omvandla dem till en mer användbar form, till exempel att extrahera postnumret eller postnumret från en adress.

När modellen har byggts kan utvecklare komma åt den via AWS-konsolen eller API-samtal, vilket gör att förutsägelser kan matas till en app eller onlinetjänst. Modeller kan finjusteras med skjutreglage i konsolen.

"Utvecklaren behöver veta mycket, väldigt lite om maskininlärning. Maskininlärningskotletter hanteras av tjänsten, " sade Wood.

Molnbaserade tjänster som detta minskar svårigheten att experimentera med maskininlärning, minskar tiden och pengarna som behövs för att lära sig färdigheterna för att komma igång, sade han.

Amazon testade hur mycket enklare tjänsten gjorde det för utvecklare att komma igång med maskininlärning och fick två utvecklare utan maskininlärningsbakgrund att bygga en modell för att förutsäga en persons kön från deras förnamn.

Det tog utvecklarna en månad att bygga sin modell, som utbildades med folkräkningsdata och förutspådde kön med 92 procents noggrannhet. Däremot tog det en utvecklare utan kunskap om maskininlärning 20 minuter att bygga samma modell med samma prediktionsnoggrannhet med Amazons tjänst.

Det är inte att säga att dessa molntjänster passar allas maskininlärningsbehov.

För en, även om de kan minska kostnaderna för att komma igång, kan de vara dyra att använda på lång sikt. Amazons tjänst kan kosta cirka 100 $ per miljon förutsägelser i regionen.

Som en entreprenör sa: "Det här skulle vara riktigt trevligt att använda vid min start, men det är kostnadsöverkomligt även på en mycket stor budget."

Tjänsten har också tagit kritik för att låsa in användare, eftersom tjänsten inte tillåter användare att exportera och importera modeller.

"Jag ser inte hur något företag med en lick av förnuft skulle låsa in deras förutsägelsemodell i AWS, " som en användare på utvecklarforumet Hacker News sa.

Trots denna kritik av den fortfarande nya tjänsten tror Wood att det kommer att leda till mer experiment med maskininlärning hos företag som tidigare inte visste var de ska börja.

"Nyckeln för mig är produktivitet och att se till att utvecklare har tillgång till det här."

© Copyright 2020 | mobilegn.com