QNA > C > Cosa Significa ~ In R?

Cosa significa ~ in R?

In generale, la tilde ('~') separa il lato sinistro di una formula con il lato destro della formula.

Per esempio, in una funzione lineare, separerebbe la variabile dipendente dalle variabili indipendenti e può essere interpretata come dire "in funzione di". So, when calling the lm() command to create a linear model of a person’s wages as a function of their years of education, you'd do something like

  1. lm (wages ~ yearsEd, data = df) 

Where df is a dataframe that has the wages and yearsEd columns which, respectively, have the wages and the years of education of all the people in your sample. Mettete prima la variabile di risposta (dipendente) e la variabile esplicativa (indipendente) dopo la tilde. Notate che il modello di cui sopra può essere descritto come un modello lineare del salario di una persona in funzione del numero di anni di istruzione che ha ricevuto.

Quando si crea un grafico di dispersione con R base, si può semplicemente specificare quale variabile mettere sull'asse y e quale sull'asse x. Per convenzione, la variabile di risposta va sull'asse y, quindi la variabile prima del '~' diventa la variabile y e la variabile dopo diventa la variabile x.

So to make a scatterplot corresponding to the above linear model, you can pretty much use the same syntax and do:

  1. plot (wages ~ yearsEd, data = df) 

So, after you make a scatterplot and think you see a linear relationship, you can take advantage of R’s command history and use that up-arrow and just change the command from plot() to lm()!

Si noti che varie funzioni e pacchetti possono usarlo in modo diverso. Per esempio ggplot2 lo usa per specificare la sfaccettatura di più grafici lungo gli assi y e x, e ce ne potrebbero essere altri.

Risposta aggiornata per essere più ampiamente applicabile dopo le grandi domande di Kiran Mahato e Diya Suresh nei commenti.

Di Derian Gutches

Che cosa significa seinen? :: Che cos'è MSME?
Link utili