10 fulls de trucs que necessiteu per assolir l’entrevista de ciència de dades


Imatge de l’autor

La llista de 10 fulls de trucs és per a principiants, estudiants, persones que busquen feina i professionals. Aquests són els meus preferits i estan escollits a mà perquè no hagis de buscar el millor full de trucs per a cada subcategoria de la ciència de dades.

Els fulls de trucs són salvavides. M’ha ajudat diverses vegades quan em preparava per a entrevistes de ciència de dades i aprenentatge automàtic. Només em va costar 30 minuts revisar tots els conceptes antics però necessaris i preparar-me per a qualsevol pregunta tècnica.

La llista de fulls de trucs cobreix:

 1. SQL
 2. raspat web
 3. Estadístiques
 4. Discriminació de dades
 5. Visualització de dades
 6. Intel · ligència de negocis
 7. aprenentatge automàtic
 8. aprenentatge profund
 9. Processament del llenguatge natural
 10. Super Cheat Sheets.

Nota: Alguns dels fulls de trucs són PDF que es poden baixar, d’altres estan basats en HTML i d’altres estan escrits en estil bloc.

10 fulls de trucs que necessiteu per assolir l'entrevista de ciència de dades
Mostra de full de trucs de Dataquest

SQL de Dataquest és un full de trucs d’estil de bloc. Us donarà una visió general de les consultes SQL bàsiques.

 • Fonaments: seleccionant files i columnes, comentaris i límits
 • Uneix-te: unió interior, esquerra, dreta i exterior
 • Consultes complexes: subconsultes, coincidència de cadenes, majúscules i minúscules, amb clàusula, creació i eliminació de vistes, unió, intersecció i encadenament

Com a científic de dades, heu de ser conscient d’aquestes funcions i ordres per passar la sessió d’entrevista de codificació SQL. Fins i tot després d’això, serà una part important de la teva vida laboral. L’extracció de dades específiques, la creació de canalitzacions, el processament de les dades i la creació d’anàlisis, tot utilitzant ordres SQL i consultes complexes.

10 fulls de trucs que necessiteu per assolir l'entrevista de ciència de dades
Imatge de Frank Andrade

Web Scraping de Frank Andrade és un full de trucs basat en blocs que cobreix tots els conceptes bàsics del web scraping i com podeu utilitzar-lo per crear rastrejadors web automatitzats. Per a un professional de dades que tingui habilitats de raspat web és un avantatge. Els ajudarà a recopilar dades de llocs web i API basats en HTML.

Aprendràs sobre:

 1. HTML per a Web Scraping
 2. Sopa preciosa
 3. XPath
 4. Seleni
 5. Scrapy
 6. Conceptes bàsics de Python per al raspat web

El full de trucs conté exemples de codi fàcils de seguir amb ajuda visual. Podeu aprendre les funcions de diverses biblioteques de Python de raspat web i automatitzar el vostre flux de treball.

10 fulls de trucs que necessiteu per assolir l'entrevista de ciència de dades
Exemple de full de trucs de stanford.edu

Les estadístiques de stanford.edu són un full de trucs basat en HTML. Cobreix tots els conceptes estadístics amb fórmules matemàtiques i exemples visuals sempre que sigui possible.

Es divideix en 5 parts bàsiques:

 1. Estimació de paràmetres
 2. Intervals de confiança
 3. Comprovació d’hipòtesis
 4. Anàlisi de regressió
 5. Anàlisi de correlació

Durant la presentació dels treballs tècnics, heu d’avalar la vostra reclamació amb les terminologies estadístiques. Llegir el full de trucs durant 5 minuts us ajudarà a recordar les terminologies i les fórmules bàsiques.

10 fulls de trucs que necessiteu per assolir l'entrevista de ciència de dades
Exemple de full de trucs de DataCamp

Pandas Data wrangling de DataCamp és un full de trucs d’una pàgina basat en PDF. Consisteix en diverses tècniques de discussió de dades amb codi i exemples visuals.

 1. Reforma de les dades: pivotar, taula pivotant, apilar i desapilar i fondre.
 2. Iteracions
 3. Gestió de les dades que falten
 4. Indexació anticipada: reindexació, configuració i desactivació de l’índex i índex multinivell.
 5. Dades duplicades
 6. Agrupació de dades
 7. Taula de combinació: fusionar, unir i concatenar
 8. dates
 9. Visualització

És un gran recurs per revisar totes les funcions bàsiques de la biblioteca pandas.

10 fulls de trucs que necessiteu per assolir l'entrevista de ciència de dades
Imatge de DataCamp

La visualització de dades de DataCamps és el millor full de trucs per entendre la visualització de dades i quan utilitzar-les. És un full de trucs híbrid (bloc + PDF) que cobreix tots els conceptes bàsics de visualització de dades.

Aprendràs:

 1. Com capturar una tendència
 2. Com visualitzar les relacions
 3. Gràfiques de part a tot
 4. Com visualitzar un valor únic
 5. Com capturar distribucions
 6. Visualitza un flux

Podeu llegir tots els conceptes bàsics com a bloc o descarregar el fitxer PDF. Us sorprendrà com és necessari per a la selecció del gràfic.

10 fulls de trucs que necessiteu per assolir l'entrevista de ciència de dades
Exemple de full de trucs a learnovita.com

Tableau de learnovita.com és un full de trucs basat en blocs. Cobreix totes les funcions bàsiques, tipus de dades, tipus de visualització i ordres.

Consisteix en:

 1. Font de dades
 2. Extracte de dades
 3. Unió de dades
 4. Combinació de dades
 5. Operadors
 6. Expressions LOD
 7. Classificació
 8. Filtres
 9. Gràfiques

Tableau és l’eina més famosa per a Business Intelligence. Us ajudarà a realitzar anàlisis de dades, visualització i disputa amb uns quants clics. A més, podeu crear històries i un tauler en pocs minuts. Hi ha una gran demanda en treballs relacionats amb l’anàlisi de dades i la ciència de dades.

“Per obtenir la majoria d’aquests fulls de trampes, us suggeriré que marqueu aquesta pàgina i reviseu tots els fulls de trampes. Només us trigarà 30 minuts a revisar totes les API, ordres i termes tècnics”.

10 fulls de trucs que necessiteu per assolir l'entrevista de ciència de dades
Exemple de full de trucs de DataCamp

L’aprenentatge automàtic amb Scikit-Learn de DataCamp és un full de trucs basat en PDF que us ajudarà a revisar totes les funcions i ordres per al processament i modelatge de dades.

Aprendràs l’API de Scikit-Learn:

 1. Càrrega de dades
 2. Preprocessament
 3. Divisió de dades
 4. Model d’edifici
 5. Formació de model
 6. Predicció
 7. Avaluació del model
 8. Afinació del model

Aquest full de trucs és molt útil per codificar exàmens, entrevistes tècniques o simplement revisar ordres per executar tasques senzilles d’aprenentatge automàtic.

10 fulls de trucs que necessiteu per assolir l'entrevista de ciència de dades
Exemple de full de trucs de DataCamp

Deep Learning with Keras by DataCamp és un full de trucs basat en PDF que es pot utilitzar per revisar totes les diferents funcions de Keras des del preprocessament de dades i les xarxes neuronals.

T’ajudarà amb:

 1. S’està carregant el conjunt de dades predeterminat
 2. Preprocessament
 3. Arquitectura del model de xarxa neuronal
 4. Predicció
 5. Inspecció del model
 6. Elaboració de models
 7. Model de formació i avaluació
 8. Desa i càrrega de models
 9. Afinació fina

És un full de trucs basat en codi i suposa que enteneu els conceptes bàsics de la creació i formació de xarxes neuronals. Amb una sola mirada, entendreu diverses funcions que us ajudaran durant la codificació d’entrevistes i les tasques per portar a casa.

10 fulls de trucs que necessiteu per assolir l'entrevista de ciència de dades
Exemple de full de trucs de janlukasschroeder

NLP de janlukasschroeder és un full de trucs únic sobre el processament del llenguatge natural (NLP). És un full de trucs basat en GitHub on tot es crea amb Markdown al fitxer README.md.

Aprendràs sobre:

 1. Incrustacions de paraules
 2. Stop Words
 3. Travessos
 4. Tokenització
 5. Trossos i trossos
 6. Etiquetatge de part de parla (POS).
 7. Etiquetatge BILUO
 8. Sortida
 9. Lematització
 10. Detecció de frases
 11. Anàlisi de dependències
 12. Reconeixement d’entitats anomenades (NER)
 13. Classificació de textos
 14. Similitud
 15. N-grams
 16. Visualització
 17. nuclis
 18. Resum de textos
 19. Anàlisi de sentiments
 20. Distància de Levenshtein
 21. Procés de decisió de Markov
 22. Probabilitat de descartar paraules per reduir el soroll

Té tot el que voleu aprendre sobre els conceptes bàsics de la PNL i les aplicacions basades en llenguatge. També aprendràs diverses arquitectura NN, funcions de pèrdua, optimitzadors i reguladors. Si t’agrada el full de trucs, posa-li una estrella.

10 fulls de trucs que necessiteu per assolir l'entrevista de ciència de dades
Exemple de full de trucs de GitHub

Super Data Science de Maverick Lin és un full de trucs de diverses pàgines basat en PDF i el meu favorit. Cobreix tots els temes sobre algorismes a SQL. El full de trucs és purament teòric amb ajuda matemàtica i visual.

Consta de diverses categories:

 1. Probabilitat
 2. Estadístiques
 3. Tipus de dades
 4. Neteja de dades
 5. Enginyeria de Característiques
 6. Anàlisi estàtica
 7. Distribucions
 8. Modelització de mètriques d’avaluació
 9. Regressió lineal
 10. Mètodes de distància
 11. Classificació de veïns més propers
 12. Agrupació
 13. aprenentatge automàtic
 14. aprenentatge profund
 15. dades massives
 16. Teoria dels grafs
 17. SQL

Si ets mandrós com jo, crec que t’agradarà revisar-ho d’una vegada i tenir confiança en l’entrevista. No estic dient que hagis d’ignorar tot l’anterior. Tots deu són necessaris perquè tinguis èxit en qualsevol etapa d’entrevista de ciència de dades, anàlisi de dades o aprenentatge automàtic. Especialment en HTML i publicacions de bloc.

Abid Ali Awan (@1abidaliawan) és un professional de científic de dades certificat que li encanta crear models d’aprenentatge automàtic. Actualment, s’està centrant en la creació de continguts i escrivint blocs tècnics sobre aprenentatge automàtic i tecnologies de ciència de dades. Abid té un Màster en Gestió Tecnològica i un grau en Enginyeria de Telecomunicació. La seva visió és crear un producte d’IA mitjançant una xarxa neuronal gràfica per a estudiants que lluiten amb malalties mentals.

Leave a Comment

Your email address will not be published. Required fields are marked *