Come aggiornare un modello (regressione o classificazione) con nuovi dati in Python
Sono stato in una posizione simile alla tua non troppo tempo fa. Supponendo che tu abbia anche una certa esperienza di SQL dai tuoi studi e lavori precedenti, ti consiglierei quanto segue:
- Scarica e installa la distribuzione Anaconda di Python, includerà un'installazione base con molti pacchetti utili. Se siete a vostro agio nella linea di comando o vi piace buttarvi a capofitto, potreste considerare Docker come un'alternativa e usare un'immagine di Anaconda. Anaconda e Docker - Meglio insieme per la scienza dei dati riproducibile
- Esplora alcuni notebook Jupyter introduttivi e prendi familiarità con Pandas per la manipolazione dei dati, il plotting con matplotlib/seaborn e il machine learning con Scikit-learn/xgboost. Un buon punto di partenza potrebbe essere qui - Top 10 IPython Notebook Tutorials for Data Science and Machine Learning
- Considerando che avete esperienza nella statistica inferenziale, imparare la statistica bayesiana in Python aggiungerà più potenza di fuoco nella vostra cassetta degli attrezzi. PyMC è un buon punto di partenza o semplicemente google Python Bayesian statistics per maggiori dettagli.
- Guardate l'ODBC e altre connessioni a dove risiedono i vostri dati in modo da poter interagire direttamente con i vostri dati senza dover tirare e scrivere dati da A a B. Pyodbc è un buon punto di partenza.
- Quando arrivate qui, concentratevi su ciò che pensate possa essere utile al vostro lavoro proseptivo o che vi interessa veramente. Questo potrebbe essere un ulteriore studio di specifici algoritmi di machine learning divisi per casi d'uso (regressione, classificazione, clustering, anomaly detection, recommender systems etc) o la sperimentazione di machine learning o la creazione di dashboard e data viz interattivi usando Plotly, D3.js, Tableau o graph analytics o deep learning o web scraping o una delle tante altre cose nel campo brillantemente ampio della scienza dei dati.
La scienza dei dati è una di quelle cose dove si ottiene davvero ciò che si mette dentro. In parole povere - più intelligenti e duri lavorate, più alti saranno i vostri ritorni. Dal momento che stai già facendo grandi domande qui, scommetto che sei già sulla strada giusta. Tutto il meglio e continua il buon lavoro!
Articoli simili
- Qual è la differenza tra modello AR, modello ARMA e modello ARIMA?
- Ha davvero senso passare a un nuovo smartphone ogni anno con un altro nuovo modello (iPhone o Samsung Galaxy)? Vale la pena di aggiornare ogni anno?
- Cos'è la classificazione IP di uno smartphone?
- Perché la CNN è usata per la classificazione delle immagini e perché non altri algoritmi?