La “cua llarga” de l’IA impedeix l’adopció madura, diu Andrew Ng

Andreu Ng

Andrew Ng és un dels noms més importants de la Intel·ligència Artificial i l’Aprenentatge automàtic, després d’haver estat liderant i fundant equips a Google Brain, Baidu i altres llocs, i com a fundador de Coursera i Landing AI. Els seus cursos en línia han atret milions de visites.

La IA té un gran potencial fora del programari de consum i les aplicacions d’Internet, creu. Però mentre camina per les instal·lacions dels usuaris parlant amb els gestors de projectes sobre la seva feina, troba un sector que necessita desesperadament orientació i lideratge:

Crec que el potencial més gran de la IA encara tenim per davant, utilitzar-lo per a totes les altres indústries que no siguin només el programari de consum i Internet. Tot, des de venda al detall, viatges, transport i logística, automoció i muntatge, i molts, molts més.

Però sincerament, quan camino per tot arreu, des de les fàbriques fins als hospitals, només busquen mentors. Crec que l’adopció de la IA en totes aquestes indústries encara és molt incipient. Un estudi de McKinsey estimava un valor anual de 13 bilions de dòlars el 2030. Però crec que encara ens queda molta feina per crear aquest valor. La IA no pot assolir tot el seu potencial fins que no sigui accessible per a tothom.

Aleshores, per què la IA no s’adopta de manera més àmplia o madura en molts sectors? Segons Ng, es deu a un problema de cua llarga o de personalització. Ell explica:

Això és el que vull dir. Si voleu agafar tots els projectes d’IA potencials i reals i ordenar-los per ordre decreixent de valor, obteniu una corba. Estem a l’esquerra i potser el sistema d’IA comercial més valuós del món és algun sistema d’anuncis en línia, i potser el segon és algun motor de cerca web que mostra els resultats més rellevants. I llavors potser amb vehicles autònoms hi arribarem algun dia en el futur.

Per tant, al món de la IA, hem descobert com contractar desenes o centenars d’enginyers d’aprenentatge automàtic per construir un sistema monolític gegant per servir milions, centenars de milions o fins i tot milers de milions d’usuaris. Però una vegada que entrem a altres indústries, veig molts projectes que potser valen entre 1 i 5 milions de dòlars cadascun, des d’una cadena de pizzes que vol fer una previsió de la demanda completa, o un fabricant de samarretes que vol millorar la col·locació de productes, o com fer un millor control de qualitat en la fabricació d’automòbils.

[The problem is that] a tot arreu, fora del programari de consum i d’Internet, no tenim aquestes bases de dades de 100 milions d’usuaris a les quals aplicar un sistema d’IA. En canvi, veig desenes de milers de projectes que no s’estan executant de manera eficaç ara mateix, a causa dels alts costos de personalització. No puc contractar 10.000 enginyers d’aprenentatge automàtic per construir 10.000 d’aquests projectes”.

Centrat en dades

Aleshores, quina és la solució? Ng argumenta:

Afortunadament, una tecnologia emergent anomenada IA ​​centrada en dades permet ara fer molts d’aquests projectes. Quan penses en què ha de fer un equip avui per construir un sistema d’IA, han d’escriure molt de codi. I tot i que espero que tothom aprengui a codificar, de manera realista és difícil aconseguir que tothom faci el programari d’IA d’avantguarda adequat per si mateix.

La majoria de la gent obté un conjunt de dades d’algun lloc i després té un equip que escrigui codi i se centra a millorar el programari, però això resulta difícil. Però amb l’enfocament centrat en les dades de la IA, hem donat la volta a aquesta recepta. Hem observat que per a moltes aplicacions d’IA, el codi ja és un problema resolt. Podria haver-hi alguna implementació de codi obert d’un model d’IA que podeu obtenir d’un proveïdor que funcioni bé. Així, en canvi, és més fructífer proporcionar les eines perquè els vostres equips treballin amb les dades”.

Utilitzant l’exemple d’un sistema d’IA dins del cotxe per identificar si un conductor o un passatger ha deixat la seva cartera/moneda al seient del cotxe, Ng demostra el repte d’ensenyar a un sistema de visió per ordinador quina disposició dels píxels significa “cartera” quan hi ha diferents dissenys. vist des de múltiples angles. Reptes similars s’enfronten els informàtics que ensenyen robots a recollir eines, per exemple, o cotxes sense conductor per reconèixer els vianants.

El problema no és el maquinari ni la codificació de l’aplicació, sinó com s’etiqueten les dades de manera coherent i correcta, diu:

Amb la IA centrada en les dades, podeu augmentar l’accés a la IA per als equips perquè en lloc de necessitar l’experiència per escriure el codi, només necessiteu l’experiència per saber què és una cartera en un cotxe. El que realment estàs intentant fer és proporcionar i descriure dades d’una manera molt coherent. Per tant, la clau d’aquest viatge per democratitzar l’accés a la IA és no només deixar que es construeixin els sistemes de 100 milions de dòlars o mil milions de dòlars, sinó que es construeixin tots aquests projectes d’entre 1 i 5 mil milions de dòlars a la cua.

Amb la IA centrada en les dades, es tracta de proporcionar formació a més persones, però a experts en la matèria i no a enginyers d’aprenentatge automàtic. Això és el que està fent el meu equip i el que molts altres estan intentant fer en diferents àrees d’aplicació. Espero que aquests proporcionaran una base amb la qual puguem donar accés a molta més gent i a molta més gent la capacitat de crear sistemes d’IA personalitzats”.

La meva presa

Un punt evident, potser, però important. Amb tantes eines d’IA sofisticades existents, el veritable repte és l’etiquetatge precís i coherent en àrees específiques de la indústria, fins i tot en conjunts de dades relativament petits (a diferència dels que contenen milions d’elements).

Amb sort, el perfil de Ng garantirà que les eines centrades en les dades s’adopten més àmpliament, en lloc que els líders empresarials gastin milions de dòlars recreant la roda quan el que es necessita és més dades sobre la roda en si.

.

Leave a Comment

Your email address will not be published. Required fields are marked *