QNA > C > Come Aggiornare Un Modello (Regressione O Classificazione) Con Nuovi Dati In Python

Come aggiornare un modello (regressione o classificazione) con nuovi dati in Python

Sono stato in una posizione simile alla tua non troppo tempo fa. Supponendo che tu abbia anche una certa esperienza di SQL dai tuoi studi e lavori precedenti, ti consiglierei quanto segue:

  1. Scarica e installa la distribuzione Anaconda di Python, includerà un'installazione base con molti pacchetti utili. Se siete a vostro agio nella linea di comando o vi piace buttarvi a capofitto, potreste considerare Docker come un'alternativa e usare un'immagine di Anaconda. Anaconda e Docker - Meglio insieme per la scienza dei dati riproducibile
  2. Esplora alcuni notebook Jupyter introduttivi e prendi familiarità con Pandas per la manipolazione dei dati, il plotting con matplotlib/seaborn e il machine learning con Scikit-learn/xgboost. Un buon punto di partenza potrebbe essere qui - Top 10 IPython Notebook Tutorials for Data Science and Machine Learning
  3. Considerando che avete esperienza nella statistica inferenziale, imparare la statistica bayesiana in Python aggiungerà più potenza di fuoco nella vostra cassetta degli attrezzi. PyMC è un buon punto di partenza o semplicemente google Python Bayesian statistics per maggiori dettagli.
  4. Guardate l'ODBC e altre connessioni a dove risiedono i vostri dati in modo da poter interagire direttamente con i vostri dati senza dover tirare e scrivere dati da A a B. Pyodbc è un buon punto di partenza.
  5. Quando arrivate qui, concentratevi su ciò che pensate possa essere utile al vostro lavoro proseptivo o che vi interessa veramente. Questo potrebbe essere un ulteriore studio di specifici algoritmi di machine learning divisi per casi d'uso (regressione, classificazione, clustering, anomaly detection, recommender systems etc) o la sperimentazione di machine learning o la creazione di dashboard e data viz interattivi usando Plotly, D3.js, Tableau o graph analytics o deep learning o web scraping o una delle tante altre cose nel campo brillantemente ampio della scienza dei dati.

La scienza dei dati è una di quelle cose dove si ottiene davvero ciò che si mette dentro. In parole povere - più intelligenti e duri lavorate, più alti saranno i vostri ritorni. Dal momento che stai già facendo grandi domande qui, scommetto che sei già sulla strada giusta. Tutto il meglio e continua il buon lavoro!

Di Drandell Kearney

DC Comics: Per cosa sta SHAZAM? :: Quali sono le migliori app per le coppie?
Link utili