Qual è il miglior portatile per uno scienziato dei dati?
La qualità più importante sarà il livello di supporto per il vostro sistema operativo di scelta per il vostro ambiente di scripting di scelta. Quasi tutti lavorano con R o Python. Entrambi hanno enormi ecosistemi, quindi non è abbastanza per installare semplicemente uno dei due. Avete bisogno di un buon modo per assicurarvi che un'ampia varietà di moduli di supporto (che conterranno la maggior parte delle routine quotidiane che userete per manipolare e capire i vostri dati) si installino, compilino ed eseguano in modo efficiente sulla vostra macchina. Per me, questo mi ha sempre spinto verso un sistema operativo Unix, che per i portatili ha sempre significato un MacBook.
Detto questo, Apple sta diventando progressivamente più fastidiosa con le scelte di packaging per OSX, e infatti ora mi affido quasi esclusivamente a gestori di pacchetti di terze parti come homebrew. Sembra che ci siano cose simili per Windows al giorno d'oggi (e di solito è possibile ottenere un gusto o due di linux per funzionare abbastanza bene sulla maggior parte dei computer portatili senza troppi problemi al giorno d'oggi). Così, mentre penso che qualche anno fa un MacBook era l'unica scelta sensata, le cose si sono probabilmente aperte ora, e la decisione conta meno.
Per quanto riguarda l'hardware, non preoccupatevi di nulla se non della RAM (16GB o più è meglio) e in misura minore della capacità di archiviazione (mezzo TB è più che sufficiente). Userete il vostro portatile per piccole analisi di dati (ad esempio meno di un GB), ma più RAM avete e meno dovrete pensare di usare una nuova variabile locale per memorizzare qualche permutazione dei vostri dati. Avere memoria per avere più versioni della stessa cosa durante la sperimentazione è davvero utile. Potreste trovarvi a voler tenere alcuni grandi database in locale, ma non vi troverete mai a voler addestrare una rete neurale sul vostro computer di tutti i giorni che usate anche per navigare sul web, codificare e guardare Netflix. Ci sono un sacco di soluzioni di cloud computing per quel tipo di lavoro, o se vi trovate a farlo tutto il tempo, investirete in un desktop a gpu multiple di alto livello.