El fundador de Looker ajuda a crear un nou llenguatge d’exploració de dades, Malloy

(EvalCo/Shutterstock)

Lloyd Tabb es manté ocupat des que Looker es va vendre a Google el 2019. L’últim projecte de codi obert per al prolífic informàtic i el seu equip de Google és Malloy, un nou llenguatge que es basa en SQL, però que segons Tabb és més accessible i més senzill d’utilitzar. .

Malloy es descriu a la seva pàgina de GitHub com “un llenguatge experimental per descriure relacions i transformacions de dades. És alhora un llenguatge de modelatge semàntic i un llenguatge de consultes que executa consultes a una base de dades relacional”.

Una de les característiques clau de Malloy, que es va presentar a mitjans de 2021, és la seva capacitat de treballar amb conjunts de dades imbricats, especialment els compatibles amb BigQuery. El llenguatge també genera SQL compatible amb Postgres.

L’equip de desenvolupament que hi ha darrere de Malloy diu que combinant el llenguatge de modelatge i consulta, Malloy simplifica gran part del treball de dades que es fa actualment en SQL, fent que els càlculs siguin modulars, componibles, reutilitzables i extensibles “de manera coherent amb els paradigmes de programació moderns”. ”

“SQL és complet però lleig”, escriuen els patrocinadors de Malloy al fitxer readme de GitHub. “Tot és expressable, però res és reutilitzable; les idees simples són complexes d’expressar; l’idioma és detallat i no té valors predeterminats intel·ligents. Malloy és immediatament comprensible pels usuaris d’SQL i molt més fàcil d’utilitzar i aprendre.

La mateixa consulta escrita a la sintaxi Malloy (a dalt) versus a la sintaxi SQL (a baix)

Malloy està dissenyat per ser un llenguatge per a qualsevol persona que treballi amb SQL, inclosos els analistes de dades, els científics de dades, els enginyers de dades o qualsevol altra persona que creï una aplicació de dades, escriuen els patrocinadors del projecte.

“Si coneixeu SQL, Malloy se sentirà familiar, encara que més potent i eficient”, escriuen. “Malloy us permet modelar a mesura que aneu, de manera que no hi ha un treball inicial pesat abans de poder començar a respondre preguntes complexes, i el model mai no us frena ni limita”.

El compromís inicial de GitHub per a Malloy es va fer l’agost de 2021 per Tabb i el seu equip a Google Cloud. L’equip va crear anteriorment una extensió de Visual Studio Code anomenada Malloy Workspace que permet als usuaris crear models, consultes, mètriques i taulers de control a Malloy.

La demostració de Malloy Workspace mostra com un usuari pot crear un model de dades sobre la marxa mentre explora dades i escriu consultes. La demostració, que es basa en una mostra de dades de l’aeroport, mostra com Malloy permet a l’usuari crear un model de dades nou o donar-ne forma a un d’existent mentre defineixen les relacions de dades, escrivint consultes i agregant i unint dades.

Les dades niuades, en particular, són més fàcils de treballar a Malloy que a les eines SQL estàndard, diuen els patrocinadors del projecte. Un usuari pot crear conjunts de dades imbricats, que Malloy executarà junts en una sola consulta a la base de dades. “Les trampes del ventilador i l’avenc es resolen, cosa que fa possible agregar qualsevol cosa en una sola consulta i redueix la necessitat de taules de fets i SQL massa complex”, afirma el projecte al readme de Malloy.

LL’últim projecte de loyd Tabb és el nou llenguatge Malloy

Aquesta setmana, Tabb, que enumera el seu títol com a “coses @ Google”, va tuitejar sobre el llançament de Malloy Composer, que és una nova aplicació creada per a Malloy. Hi ha disponible una demostració que mostra com es pot utilitzar Mallow Composer (que sembla que té un aspecte més d’interfície d’usuari de Google) per explorar dades i crear consultes amb una varietat de dimensions, filtres i dades imbricades.

D’alguna manera, Malloy sembla tenir certa similitud amb LookML, el llenguatge de modelatge desenvolupat per Looker com a component bàsic de la plataforma Looker. LookML va permetre als usuaris crear relacions de dades fora d’SQL i reutilitzar-les d’una manera que no era compatible directament amb SQL. Els clients que es van dedicar a definir els seus models de dades mitjançant LookML tenien diversos avantatges, com ara una major coherència en les seves anàlisis i la capacitat de generar ràpidament nous productes de dades a la plataforma Looker.

Tanmateix, Tabb diu que Malloy és diferent de LookML perquè està totalment basat en llenguatge. “[O]El nostre objectiu és utilitzar Malloy a tots els llocs on escriuries un SQL SELECT”, va escriure a Twitter.

Tabb, que abans treballava a Borland i Netscape, va fundar Looker el 2011. L’empresa de Santa Cruz, Califòrnia, va créixer ràpidament com a eina d’anàlisi de dades de nova generació. Google va adquirir Looker per 2.600 milions de dòlars el 2019. Tabb era un datanami Persona a veure per al 2018.

Malloy no és un producte oficial i no hi ha suport per part de Google ni de ningú més. L’extensió Malloy VSCode es pot descarregar des del mercat VSCode. Hi ha més informació disponible al dipòsit de Looker GitHub a https://github.com/looker-open-source/malloy.

Elements relacionats:

Els Data Nerds han guanyat

L’Audacious Moonshot de Looker per superar l’Oracle

Com SQL++ fa que JSON sigui més consultable

Leave a Comment

Your email address will not be published. Required fields are marked *