Les 15 biblioteques R més populars que heu de conèixer el 2022

Tot i que avui en dia moltes persones opten per Python per a tasques d’aprenentatge automàtic, R continua sent un element bàsic en el conjunt d’eines de qualsevol desenvolupador. Amb el seu codi net, la capacitat d’encadenar funcions i l’operador de canonades, R sovint pot fer que les tasques senzilles siguin molt fàcils de fer. També es manté bé en tasques complexes com la predicció o la modelització.

En general, R avui és més fort que mai, amb una llista de biblioteques admeses en constant expansió.

Aquí teniu les 15 biblioteques R per a l’aprenentatge automàtic publicats el 2022!

fastTopics

El paquet implementa algorismes per al recompte de dades dels models de temes d’ajust i la factorització matricial no negativa. Els mètodes exploten la relació entre l’índex semàntic latent probabilista i la factorització matricial no negativa de Poisson.

fastTopics ofereix eines per comparar, anotar i visualitzar models. Crea “trama d’estructura” i identifica les característiques clau.

Consulta la documentació aquí.

Metrica

El paquet compila més de 80 funcions i està dissenyat per avaluar el rendiment de predicció de models de previsió puntual de regressió i classificació com ara DNDC, APSIM, DSSAT i més.

Metrica ofereix una caixa d’eines amb un ampli espectre de mètriques d’error, índexs i coeficients per a diferents característiques entre els valors predits i observats, juntament amb algunes funcions bàsiques de visualització per avaluar el rendiment dels models proporcionats en format personalitzable (ggplot).

Consulta la documentació aquí.

SparseVFC (Consens de camp vectorial escàs per a l’aprenentatge de camp vectorial)

El paquet SparseVFC implementa l’algorisme de consens de camp vectorial dispers (SparseVFC) per a un aprenentatge robust de camps vectorials. Es tradueix en gran part de les funcions de MATLAB a https://github.com/jiayi-ma/VFC.

Consulta la documentació aquí.

aigua

Basat en el paquet h2oparsnip, agua permet als usuaris ajustar, optimitzar i avaluar models mitjançant H2O mitjançant la sintaxi tidymodels. No obstant això, la majoria dels usuaris hauran d’utilitzar les funcions mitjançant el nou motor computacional de xirivia “h2o”.

Mentre s’ajusta el model, les dades es passen directament al servidor d’h2o. Les dades es passen una vegada per ajustar-les i es donen instruccions a h2o.grid() per processar-les.

Consulta la documentació aquí.

IA oberta

OpenAI és un embolcall R de punts finals de l’API OpenAI. Aquest paquet cobreix els motors, les finalitzacions, les edicions, els fitxers, les ajustos, les incrustacions i les cerques heretades, les classificacions i les respostes.

Per utilitzar l’API d’OpenAI, heu de proporcionar una clau d’API. Per començar, registreu-vos a l’API OpenAI en aquesta pàgina. Un cop us registreu i inicieu sessió, heu d’obrir aquesta pàgina, fer clic a “Personal” i seleccionar “Mostra les claus de l’API” al menú desplegable. A continuació, podeu copiar la clau fent clic al text verd ‘Copia’.

Consulta la documentació aquí.

webmorphR

Amb un enfocament en els estímuls facials, webmorphR pretén fer que la construcció d’estímuls d’imatge sigui més coherent.

Els estímuls utilitzats en la investigació no es poden compartir per raons ètiques, però webmorphR permet compartir receptes per crear estímuls, fomentant la generalització a cares noves.

Consulta la documentació aquí.

cita

‘cito’ pretén ajudar-vos a construir i entrenar xarxes neuronals amb la sintaxi R estàndard. Permet tot el procés de creació i formació del model amb una línia de codi. A més, tots els mètodes genèrics de R es poden utilitzar a l’objecte creat.

cito es basa en el marc “torch” disponible per a R. Com que és natiu de R, no es necessita cap instal·lació de Python per a aquest paquet.

Consulta la documentació aquí.

ser

L’objectiu d’etree és proporcionar una implementació amigable d’Energy Trees, un model de classificació i regressió amb dades estructurades i de tipus mixt. Actualment, el paquet cobreix funcions i gràfics com a covariables estructurades.

Consulta la documentació aquí.

mildsvm

El paquet proporciona una manera senzilla d’aprendre de les dades entrenant classificadors basats en la màquina de vectors de suport (SVM). A més, conté funcions útils per crear i imprimir marcs de dades de múltiples instàncies.

Consulta la documentació aquí.

aorsf

Els arbres de decisió es desenvolupen dividint les dades d’entrenament en dos nous subconjunts per tenir més similitud dins dels nous subconjunts que entre ells. El procés de divisió es repeteix en els subconjunts de dades resultants fins que es compleix un criteri d’aturada.

Consulta la documentació aquí.

banda de calibratge

Un paquet R per avaluar el calibratge de les prediccions de resultats binaris. Escrit per Timo Dimitriadis (Universitat de Heidelberg), Alexander Henzi (Universitat de Berna) i Marius Puke (Universitat de Hohenheim).

Una avaluació de calibratge honesta per a prediccions de resultats binaris proporciona funcions per avaluar el calibratge de classificadors probabilistes mitjançant bandes de confiança per a funcions monòtones. També facilita la construcció de proves de bondat d’ajust invertides, el rebuig de les quals permet una conclusió buscada d’un model prou ben calibrat.

Consulta la documentació aquí.

etiquetes ordenades

L’objectiu de tidytags és fer que la recopilació de dades de Twitter sigui més accessible i robusta. tidytags recupera les dades de tweets recollides per un full de Google d’arxiu de Twitter (TAGS), obté metadades addicionals de Twitter mitjançant el paquet rtweet R i proporciona funcions addicionals per facilitar l’anàlisi sistemàtica però flexible de dades de Twitter. TAGS es basa en fulls de càlcul de Google. Un rastrejador TAGS recull contínuament tuits de Twitter en funció de criteris de cerca predefinits i freqüència de recollida.

Consulta la documentació aquí.

Mlim

Actualment implementat com a paquet R, el programari aporta aprenentatge automàtic per proporcionar una solució versàtil de dades que falten per a diversos tipus de dades: contínua, binària, multinomial i ordinal. En poques paraules, s’espera que mlim superi qualsevol altre programari d’imputació de dades que falten disponible per molts motius.

L’alt rendiment de mlim es deu principalment a l’ajustament d’un algorisme ELNET, que sovint supera qualsevol procediment estadístic estàndard o algorisme d’aprenentatge automàtic no ajustat i també es generalitza molt bé.

Consulta la documentació aquí.

Kernelshap

El paquet “kernelshap” implementa un perfeccionament multidimensional de l’algoritme Kernel SHAP descrit a Covert i Lee (2021). El paquet permet calcular els valors SHAP del nucli exactament mitjançant el mostreig iteratiu (com a Covert i Lee, 2021) o mitjançant un híbrid dels dos. Tan bon punt s’involucra el mostreig, l’algoritme itera fins que es proporcionen errors estàndard i convergència.

Consulta la documentació aquí.

Survex

Basat en DALEX, aquest paquet ofereix explicacions independents del model per als models de supervivència. Els usuaris que no estiguin familiaritzats amb l’aprenentatge automàtic explicable poden fer referència a l’anàlisi de models explicatius, que fa que la majoria dels mètodes inclosos a survex els esten descrits a EMA i implementats a DALEX però a models amb sortida funcional.

Consulta la documentació aquí.

Leave a Comment

Your email address will not be published. Required fields are marked *