Les millors alternatives de Google Colab per a projectes d’aprenentatge automàtic i ciència de dades

Què és Google Colab?

Colaboratory, de vegades anomenat “Colab”, és un producte de Google Research. Permet a qualsevol persona crear i executar codi Python arbitrari a través del navegador. Tècnicament parlant, Colab és un servei de portàtil allotjat de Jupyter que ofereix accés gratuït a recursos informàtics, incloses les GPU, i no requereix cap configuració. Com a millor iteració de Jupyter Notebook, Google Colab es pot caracteritzar. L’anàlisi de dades, l’ensenyament i l’aprenentatge automàtic són tres àrees on Colab destaca.

Funcions de Google Colab

Les característiques interessants que ofereix cada IDE contemporani són abundants a Google Colab, a més de moltes altres. A continuació es mostra una llista d’alguns dels aspectes més fascinants.

  • Tutorials interactius per a l’aprenentatge de xarxes neuronals i aprenentatge automàtic.
  • Sense una configuració local, escriviu i executeu codi Python 3.
  • Executeu ordres al terminal des del bloc de notes.
  • Importació de dades de fonts externes com Kaggle.
  • Els vostres quaderns es poden desar a Google Drive.
  • Es poden importar quaderns de Google Drive.
  • GPU, TPU i serveis al núvol de forma gratuïta.
  • Integreu Open CV, Tensor Flow i PyTorch.
  • Importa o publica fàcilment a/des de GitHub.

Què és Google Colab Pro?

Colab dóna la màxima prioritat a la informàtica interactiva. Els temps d’execució caducaran si no esteu actiu. Segons la disponibilitat i les tendències d’ús, els quaderns de l’edició gratuïta de Colab poden funcionar fins a 12 hores. En funció del saldo de les vostres unitats de càlcul, Colab Pro us ofereix una disponibilitat de càlcul millorada.

En general, els ordinadors portàtils tenen un temps màxim de funcionament de 12 hores, depenent de la disponibilitat i dels patrons d’ús. La terminació del backend és el que podeu anticipar si feu servir totes les unitats de càlcul d’un Pro. Si teniu unitats computacionals adequades, Colab Pro+ permet l’execució contínua de codi fins a 24 hores. Els temps d’espera d’inactivitat només tenen efecte un cop finalitza l’execució del codi.

GPU més ràpides, sessions més llargues, menys interrupcions, accés al terminal i més memòria RAM són només alguns dels problemes que Colab Pro i Colab Pro+ aborden per als enginyers d’aprenentatge automàtic i els científics de dades. No obstant això, les ofertes de Colab Pro encara han de ser més limitades.

  • Tots els ciutadans excepte alguns països no poden utilitzar Colab Pro o Pro+.
  • Les restriccions de GPU per a Colab Pro i Pro+ són NVIDIA P100 o T4.
  • La memòria RAM està limitada a Colab Pro a 32 GB i Pro+ a 52 GB.
  • Colab Pro i Pro+ limiten les sessions a 24 hores.
  • Tot i que Pro+ ofereix una execució en segon pla, Colab Pro no
  • JupyterLab no està disponible en la seva totalitat a través de Colab Pro o Pro+.
  • És possible que la vostra instància no sigui accessible perquè Colab Pro i Pro+ no ofereixen cap garantia de recursos.
Alternatives de Google Colab
SageMaker a Amazon

Una altra plataforma d’aprenentatge automàtic basada en núvol creada per Amazon el novembre de 2017 s’anomena Amazon SageMaker. Ofereix quaderns Jupyter allotjats sense necessitat de configuració. Tanmateix, no és gratuït. Sí, tot i que la prova és gratuïta, cal pagar els seus serveis (durant els dos mesos inicials).

SageMaker ofereix MXNet, Chainer i SparkML a més dels marcs d’aprenentatge profund que ofereix Google Colab, com ara Tensorflow, Scikit-Learn, PyTorch i XGBoost. Amazon SageMaker Ground Truth, Amazon Augmented AI, Amazon SageMaker Studio Notebooks, preprocessament, Amazon SageMaker Experiments i moltes altres funcions estan disponibles.

CoCalc

Una plataforma d’administració de cursos de computació en núvol (SaaS) basada en web per a matemàtiques computacionals s’anomena CoCalc o Càlcul Col·laboratiu. És un programa de codi obert que allotja SageMath Inc. Ofereix edició de documents LaTeX i fulls de treball de Sage a més del quadern Jupyter. William Stein, antic professor de matemàtiques a la Universitat de Washington, és el creador i desenvolupador principal de CoCalc.

La col·laboració en temps real és una característica que us permet compartir el vostre quadern amb altres persones i modificar-lo junts en temps real. Conté una funció d’enregistrament de l’historial que registra tots els canvis que feu a la llibreta i us permet navegar per aquests canvis mitjançant un control lliscant senzill. Per al pla gratuït de CoCalc, les sessions finalitzaran després de 30 minuts d’inactivitat, encara que puguin arribar a les 24 hores, que és el doble del que ofereix Colab. Python, Sage, R, Octave i molts altres idiomes estan disponibles.

Kaggle Kernel

Tot i que Kaggle és conegut pels seus concursos de ciència de dades, també ofereixen nuclis o quaderns gratuïts per dur a terme projectes d’aprenentatge automàtic i ciència de dades de manera independent, sense tenir en compte els concursos. Una plataforma gratuïta per executar quaderns Jupyter al navegador s’anomena Kaggle Kernels. Colab i Kaggle són tots dos productes de Google i comparteixen moltes funcions.

Kaggle ha modificat els seus nuclis per incloure memòria i capacitat de processament més importants. Conjunt de dades de 20 GB, 5 GB d’espai en disc, 9 hores d’execució, 4 CPU amb 16 GB de RAM o 2 nuclis de CPU amb 13 GB de RAM quan la GPU està encès

Enquadernador

El programa de codi obert BinderHub, que desplega el servei Binder al núvol, impulsa Binder. Podeu crear entorns informàtics únics mitjançant Binder que diversos usuaris remots poden compartir i utilitzar. Podeu introduir l’URL de qualsevol repositori de Git d’accés obert i s’obrirà a la interfície predeterminada de Jupyter Notebook. Es pot utilitzar qualsevol bloc de notes del dipòsit, però les modificacions que feu no es desaran de nou al dipòsit.

Pot ser útil quan tingueu un dipòsit ple de quaderns Jupyter. Tot i que el nombre màxim d’usuaris d’un dipòsit és de 100

Llibreta Azure

Els portàtils Azure i Colab de Microsoft són molt comparables funcionalment. Ambdós sistemes ofereixen una funció gratuïta per compartir el núvol. Pel que fa a la velocitat, Azure Notebooks triomfa i supera Colab per un ampli marge. Conté 4 gigabytes de memòria RAM. Les biblioteques són el nom dels quaderns que desenvolupa Azure Notebooks connectat. Cada fitxer de dades d’aquestes biblioteques té una mida inferior a 100 megabytes. Python, R i F# són llenguatges de programació compatibles amb Azure Notebooks. La seva interfície d’usuari nativa de Jupyter està present. Les aplicacions senzilles són més adequades per a Azure Notebooks.

IBM DataPlatform Notebooks

Amb suport per a opcions de codi obert, IBM va estrenar Data Science Experience (DSX) i Watson Data Platform el 2016. Aquestes opcions incloïen quaderns Jupyter, R, Python, Scala i Apache Spark. Finalment es va llançar la plataforma que permet la llibertat d’elecció multinúvol per al treball de ciència de dades. Això es va aconseguir amb la utilització de contenidors de productes basats en Kubernetes. Es pot configurar allà on es trobin les dades als contenidors Docker o CloudFoundry. A diferència de Google Colab, els quaderns IBM DataPlatform ofereixen contenidors per a un desplegament multinúvol o híbrid. La ciència de dades s’ha d’allotjar al núvol privat de Colab.

Com que permet als usuaris dissenyar, desplegar i operar models a qualsevol lloc, fins i tot en núvols públics competidors, IBM admet la contenidorització. Com a DSX Local, DSX és alhora un component i, opcionalment, una entitat independent de Watson Data Platform. Ofereix accés col·laboratiu i controlat per permisos a projectes, dades, eines per a ciència de dades, serveis i espai comunitari. R, Python i Scala són compatibles amb DataPlatform Notebooks, que també conserven quaderns Jupyter i Apache Zeppelin. Les biblioteques de codi obert compatibles amb DSX inclouen Spark MLlib, TensorFlow, Caffe, Keras i MXNet.

Quadern Jupyter

Una eina web de codi obert anomenada Jupyter Notebook permet als usuaris crear i compartir documents amb codi en directe, visualitzacions, equacions i text. El personal del Projecte Jupyter és l’encarregat de mantenir el Jupyter Notebook. Són projectes no relacionats que van sorgir a causa del projecte IPython. Julia, R i Python són compatibles. Les seves principals aplicacions són l’anàlisi de dades i la física computacional. Els quaderns Jupyter, com Colab, estan més preocupats per fer que el treball sigui reproduïble i entenedor. Ofereix una varietat de visualitzacions que es representen instantàniament al quadern. Té dos modes, anomenats inserir i escapar.

Omples

Replit, un IDE col·laboratiu amb una interfície de navegador. Un IDE, editor, compilador, intèrpret i REPL en línia senzill però eficaç s’anomena Replit. En més de 50 llenguatges de programació, podeu codificar, compilar, executar i allotjar. Al vostre navegador, podeu executar i desar codi quan vulgueu. Replit és compatible amb Chromebooks i altres dispositius amb un navegador web.

Característiques

  • Paquets de tercers per a Linting Debugger
  • Actualitzacions en directe i fitxers
  • desplegament i allotjament
  • Replit Classroom: eines efectives d’ensenyament i aprenentatge, invitació d’alumnes, seguiment del progrés i qualificació automàtica, aules d’intercanvi i codificació
  • Posa el codi d’execució al teu bloc o lloc web.
vscode.dev

VS Code està disponible al navegador gràcies a vscode.dev. Comenceu a codificar després d’obrir una carpeta a l’ordinador local. No es necessita cap instal·lació. Amb certes restriccions, cobreix tots els idiomes importants.

Vscode.dev ofereix coloració de sintaxi de codi, terminacions basades en text i coloració de parèntesis de parèntesis per a la majoria dels llenguatges de programació. L’ús d’un arbre de sintaxi Tree-sitter pot proporcionar diferents experiències com Outline/Go to Symbol i Symbol Search per a idiomes coneguts com C/C++, C#, Java, PHP, Rust i Go. Serveis d’idioma natius de la potència del navegador les experiències TypeScript, JavaScript i Python. Rebràs l’experiència “Bona” juntament amb completes de fitxers únics, ressaltats semàntics, errors de sintaxi i molt més amb aquests llenguatges de programació.

StackBlitz

L’editor de codi en línia per a aplicacions web s’anomena StackBlitz. Visual Studio Code serveix com a motor. Les capacitats d’edició modernes de VS Code ara estan disponibles al navegador gràcies a StackBlitz.

Característiques:

Cerca de projectes, Anar a definicions i altres capacitats de Visual Studio Code

qualsevol paquet NPM al vostre projecte per importar-lo

Depuració i previsualització en una finestra diferent

Si aneu fora de línia, encara podeu continuar editant perquè StackBlitz executa un servidor de desenvolupament en directe al navegador mitjançant les API d’aplicació web progressiva.

Compartir i incrustar: cada projecte es pot fer públic.

codi sandbox

Editor de codi en línia i IDE per al desenvolupament web ràpid: les aplicacions web de CodeSandbox es poden crear i compartir ràpidament gràcies a l’editor de codi en línia i l’eina prototip anomenada CodeSandbox. Admet marcs com Angular, React, Vue i mecanografia o javascript estàndard.

Característiques:

  • Instal·lació dels mòduls dependents de NPM.
  • La possibilitat d’incrustar la vostra caixa de sorra a qualsevol lloc.
  • Integració de GitHub.
  • Cooperació en temps real Edició col·laborativa en temps real en sandbox.
  • Sandboxes ocults/privades
  • Editor per a l’entorn d’edició de Mònaco idèntic a VSCode.
  • Programari Lliure.
Plunker

Plunker és una comunitat en línia on podeu compartir les vostres idees de desenvolupament web i crear-les junts.

Característiques:

  • Codi col·laboratiu en temps real
  • un editor de sintaxi configurable i amb totes les funcions
  • una visió en directe de les modificacions del codi
  • Escriviu el codi per endavant
  • Plunks és totalment de codi obert a GitHub i està disponible per bifurcar, discutir i compartir sota la llicència MIT.


Prathamesh Ingle és un escriptor de continguts de consultoria a MarktechPost. És enginyer mecànic i treballa com a analista de dades. També és un practicant d’IA i un científic de dades certificat amb interès en les aplicacions de la IA. Li entusiasma explorar noves tecnologies i avenços amb les seves aplicacions de la vida real


Leave a Comment

Your email address will not be published. Required fields are marked *