Avtomatizacija: prihodnost podatkovne znanosti in strojnega učenja?

Strojno učenje je bil eden največjih napredkov v zgodovini računalništva, zdaj pa velja, da lahko igra pomembno vlogo na področju velikih podatkov in analitike. Analitika velikih podatkov je z vidika podjetja velik izziv. Na primer, dejavnosti, kot so razumevanje velikega števila različnih formatov podatkov, analiza priprave podatkov in filtriranje odvečnih podatkov, so lahko intenzivne. Zaposlovanje strokovnjakov za podatkovne znanstvenike je draga ponudba in ne sredstvo za dosego cilja vsakega podjetja. Strokovnjaki menijo, da lahko strojno učenje avtomatizira številne naloge, povezane z analitiko, tako rutinske kot zapletene. Avtomatizirano strojno učenje lahko sprosti znatne vire, ki bi jih lahko uporabili za bolj zapleteno in inovativno delo. Zdi se, da se strojno učenje ves čas premika v to smer.

Avtomatizacija v kontekstu informacijske tehnologije

V informacijski tehnologiji je avtomatizacija povezava različnih sistemov in programske opreme, ki jim omogoča izvajanje posebnih nalog brez posredovanja človeka. V IT lahko avtomatizirani sistemi opravljajo preprosta in kompleksna dela. Primer preprostega opravila je lahko integracija obrazcev z datotekami PDF in pošiljanje dokumentov pravemu prejemniku, medtem ko je zagotavljanje varnostnih kopij zunaj spletnega mesta lahko primer zapletenega opravila.

Če želite svoje delo opraviti pravilno, morate programirati ali dati jasna navodila avtomatiziranemu sistemu. Vsakič, ko je za spreminjanje obsega svojega dela potreben avtomatiziran sistem, mora nekdo posodobiti program ali nabor navodil. Čeprav je avtomatiziran sistem učinkovit pri svojem delu, se lahko pojavijo napake iz različnih razlogov. Ko pride do napak, je treba ugotoviti in odpraviti glavni vzrok. Jasno je, da je avtomatiziran sistem za svoje delo popolnoma odvisen od ljudi. Bolj zapletena je narava dela, večja je verjetnost napak in težav.

Pogost primer avtomatizacije v industriji IT je avtomatizacija testiranja spletnih uporabniških vmesnikov. Testni primeri se vnesejo v skript za avtomatizacijo in uporabniški vmesnik se ustrezno preskusi. (Za več informacij o praktični uporabi strojnega učenja glejte Strojno učenje in Hadoop v Odkrivanju goljufij naslednje generacije.)

Argument v prid avtomatizacije je, da opravlja rutinske in ponavljajoče se naloge ter zaposlene osvobaja pri zahtevnejših in ustvarjalnejših nalogah. Trdi pa se tudi, da je avtomatizacija izključila veliko število nalog ali vlog, ki so jih prej opravljali ljudje. Zdaj, ko strojno učenje vstopi v različne panoge, lahko avtomatizacija doda novo dimenzijo.

Prihodnost avtomatiziranega strojnega učenja?

Bistvo strojnega učenja je sposobnost sistema, da se neprestano uči iz podatkov in se razvija brez človeškega posredovanja. Strojno učenje je sposobno delovati kot človeški možgani. Na primer, motorji priporočil na spletnih mestih za e-trgovino lahko ocenijo edinstvene preference in okuse uporabnikov ter podajo priporočila o najprimernejših izdelkih in storitvah, med katerimi lahko izbirate. Glede na to sposobnost je strojno učenje idealno za avtomatizacijo kompleksnih nalog, povezanih z velikimi podatki in analitiko. Premagal je glavne omejitve tradicionalnih avtomatiziranih sistemov, ki ne dopuščajo rednega človeškega posredovanja. Obstaja več študij primerov, ki dokazujejo sposobnost strojnega učenja za izvajanje kompleksnih nalog analize podatkov, o katerih bomo razpravljali kasneje v tem prispevku.

Kot smo že omenili, je analitika velikih podatkov izziv za podjetja, ki ga je mogoče delno prenesti na sisteme strojnega učenja. S poslovnega vidika lahko to prinese številne koristi, kot so sprostitev virov podatkovne znanosti za bolj ustvarjalne naloge in naloge, večje obremenitve, manj časa za dokončanje nalog in stroškovna učinkovitost.

Študija primera

Leta 2015 so raziskovalci MIT začeli delati na orodju za podatkovno znanost, ki lahko ustvari napovedne podatkovne modele iz velikih količin surovih podatkov z uporabo tehnike, imenovane algoritmi za globoko sintezo funkcij. Znanstveniki trdijo, da lahko algoritem združuje najboljše lastnosti strojnega učenja. Po mnenju znanstvenikov so ga preizkusili na treh različnih naborih podatkov in testiranje razširjajo na več. V prispevku, ki bo predstavljen na Mednarodni konferenci o podatkovni znanosti in analitiki, sta raziskovalca James Max Kanter in Kalyan Veeramachaneni dejala: "Z avtomatiziranim postopkom uglaševanja optimiziramo celotno pot brez človekovega vpletanja, kar ji omogoča posploševanje na različne nabore podatkov".

Poglejmo zapletenost naloge: algoritem ima tako imenovano sposobnost samodejnega prilagajanja, s pomočjo katerega je mogoče pridobiti vpogled ali vrednosti iz neobdelanih podatkov (kot sta starost ali spol), nato pa napovedni podatki modele je mogoče ustvariti. Algoritem uporablja kompleksne matematične funkcije in verjetnostno teorijo, imenovano Gaussova kopula. Zato je enostavno razumeti stopnjo kompleksnosti, ki jo lahko obvlada algoritem. Ta tehnika je osvojila tudi nagrade na tekmovanjih.

Strojno učenje bi lahko nadomestilo domače naloge

Po vsem svetu se razpravlja o tem, da bi strojno učenje lahko nadomestilo številna delovna mesta, saj opravlja naloge z učinkovitostjo človeških možganov. Pravzaprav obstaja zaskrbljenost, da bo strojno učenje nadomestilo podatkovne znanstvenike, in zdi se, da obstaja podlaga za takšno zaskrbljenost.

Za povprečnega uporabnika, ki nima znanja o analizi podatkov, vendar ima različne stopnje analitičnih potreb v svojem vsakdanjem življenju, ni mogoče uporabiti računalnikov, ki bi lahko analizirali velike količine podatkov in zagotovili podatke za analizo. Tehnike obdelave naravnega jezika (NLP) pa lahko to omejitev premagajo tako, da računalnike naučijo sprejemati in obdelovati naravni človeški jezik. Tako povprečen uporabnik ne potrebuje sofisticiranih analitičnih funkcij ali spretnosti.

IBM meni, da je mogoče potrebo po podatkovnih znanstvenikih zmanjšati ali odpraviti s svojim izdelkom, platformo Watson Natural Language Analytics. Po besedah ​​Marca Atschullerja, podpredsednika za analitiko in poslovno inteligenco pri Watsonu: »S kognitivnim sistemom, kot je Watson, samo postavite svoje vprašanje - če pa nimate vprašanja, preprosto naložite svoje podatke in Watson si jih lahko ogleda in sklepajte, kaj bi morda radi vedeli. ”

Zaključek

Avtomatizacija je naslednji logični korak v strojnem učenju, posledice pa že doživljamo v vsakdanjem življenju-spletna mesta za e-trgovino, predlogi prijateljev na Facebooku, predlogi omrežij LinkedIn in lestvice iskalnikov Airbnb. Glede na navedene primere ni dvoma, da je to mogoče pripisati kakovosti izpisa, ki ga proizvajajo avtomatizirani sistemi strojnega učenja. Ob vseh svojih lastnostih in prednostih se zdi ideja o strojnem učenju, ki povzroča veliko brezposelnost, nekoliko pretirana. Stroji že desetletja nadomeščajo ljudi v mnogih delih našega življenja, vendar so se ljudje razvili in se prilagodili, da ostanejo pomembni v industriji. Po mnenju je strojno učenje za vse njegove motnje le še en val, na katerega se bodo ljudje prilagodili.


Čas objave: avgust-03-2021