Python està menjant lentament R? La raó per la qual RStudio es va convertir en Posit

Després de la conferència anual d’usuaris de la companyia a Washington, DC, celebrada el 27 de juliol, IDE (Integrated Development Environment) RStudio va anunciar que té un nou nom: Post. El moviment va assenyalar els plans d’expansió de l’empresa amb un enfocament més enllà de R, inclosos els usuaris de Python i Visual Studio Code.

Mentrestant, la comunitat de ciència de dades de codi obert Posit va dir: “Tot i que moltes coses seguiran igual, el nostre canvi de marca produirà canvis més enllà d’un nou nom”.

RStudio fa molts anys que destaca que els seus productes comercials són “bilingües” tant per a R com per a Python. Tanmateix, la marca “RStudio” ha fet difícil convèncer les organitzacions perquè considerin els seus productes per als usuaris de Python.

Però provoca la creença que Python està suplantant d’alguna manera R per l’ecosistema de la ciència de dades?

Còctel d’idiomes

A Snowday 2022, l’empresa en núvol “Snowflake” va anunciar noves incorporacions a la seva plataforma que estan preparades per ajudar els científics de dades i els desenvolupadors a trobar noves maneres de desenvolupar canalitzacions, aplicacions i models ML amb la plataforma de dades única de l’empresa.

Llegeix: Floquet de neu ara és compatible amb Python

Al llarg dels anys, Posit (antigament, RStudio) ha passat d’eines exclusives a R a un ecosistema de llenguatge agnòstic. Hi ha hagut un canvi gradual de RStudio IDE per ser més amigable amb Python. RStudio, un nom sinònim de desenvolupament R de codi obert, es va canviar de nom per representar millor el negoci en evolució.

Això va provocar el canvi de marca d’eines i productes comercials. RStudio Connect va passar a anomenar-se “Posit Connect” i RStudio Workbench com a “Posit Workbench”. RStudio va dir en un tuit que RStudio IDE encara estarà per oferir ajuda amb el desenvolupament de R de codi obert.

El científic en cap de RStudio, Hadley Wickham, va dir: “No estem girant de R a Python”. A més, va explicar: “No deixaré d’escriure codi R. . . No aprendré Python”, posant tranquil·lament les preocupacions dels usuaris.

Tot i que RStudio busca equilibrar la proporció d’enginyers que treballen en R amb altres avenços al llarg del temps, la companyia afirma que la majoria del treball continuarà relacionat amb R.

Python pot substituir R?

Python i R s’utilitzen amb finalitats similars, però es diferencien en essència.

Python és un llenguatge de programació d’alt nivell orientat a objectes que inclou estructures de dades integrades, el que el converteix en un llenguatge de referència per al desenvolupament d’aplicacions. Les sintaxis de Python són senzilles i fàcils de llegir.

D’altra banda, R és un llenguatge de programació utilitzat per a l’anàlisi estadística de dades i inclou una àmplia gamma de tècniques de modelització lineal, proves estadístiques, modelització no lineal i agrupació. Un dels punts forts de R és la fàcil producció d’una trama, incloses les anotacions i fórmules matemàtiques.

Tanmateix, tots dos idiomes són els preferits per a la ciència de dades, l’anàlisi de dades i l’aprenentatge automàtic. R se centra principalment en l’aspecte estadístic d’un projecte, mentre que Python és flexible en la seva anàlisi i ús de dades.

R té un paper important en la visualització de dades en gràfics. Tanmateix, és difícil utilitzar aquest llenguatge en un entorn de producció a causa de les seves eines de producció “encara per desenvolupar”. En canvi, Python es pot integrar fàcilment en un entorn de treball complex.

Pel que fa al rendiment, els usuaris prefereixen Python, ja que funciona més ràpid que R en tots els entorns. No obstant això, un usuari va publicar a Reddit que Python té biblioteques “vergonyoses” en comparació amb les riques en funcions a R.

(Font: Reddit)

No obstant això, ambdós idiomes es troben entre els preferits perquè els usuaris treballin en funció del seu ús en un entorn determinat.

Una casa única per a R i Python

Amb les comunitats R i RStudio, l’empresa ha ajudat els usuaris a plantejar i respondre preguntes difícils sobre dades. Mitjançant la creació d’eines de codi obert per fer que la ciència de dades “codi primer” sigui accessible a milions de persones per establir la reproductibilitat com a línia de base per a l’anàlisi i la comunicació, l’empresa pretén fomentar el desenvolupament en una comunitat diversa.

RStudio va dir que una de les idees bàsiques en què creia la comunitat era l’imperatiu d’utilitzar programari de codi obert per al treball científic.

“El treball científic ha de ser reproduïble, resistent i ha de fomentar una participació àmplia en la creació de les eines en si”.

Hadley Wickham va dir: “El nom acabava de començar a sentir-se cada cop més restrictiu”. Tant Wickham com el director general JJ Allaire van emfatitzar que el canvi de marca no significa un desplaçament de R.

Tanmateix, un usuari afirma que, sobretot, el principal problema de R és la governança.

A Python github, els usuaris podran veure milers de sol·licituds d’extracció i problemes, amb diverses persones que estan intentant contribuir al llenguatge bàsic. A més, Python fins i tot celebra eleccions amb qualsevol persona que teòricament es converteix en un “desenvolupador bàsic de Python”.

L’usuari va dir a més: “Vols contribuir al llenguatge R bàsic? No pots. R és de codi obert pel que fa al codi font disponible, però completament tancat pel que fa al desenvolupament. Ni tan sols podeu crear directament un problema al rastrejador d’errors si trobeu un error”.

Si Python és una democràcia, R és el sistema feudal. A més, com que els desenvolupadors bàsics de R no són elegits i es pot comptar la quantitat de desenvolupadors bàsics, fa que Python sigui més divers que R.

Leave a Comment

Your email address will not be published. Required fields are marked *