Ongeldige modelformule in ExtractVars krijgen bij het gebruik van RPART-functie in R

De dataset kan worden gedownload van http: // archief .ics.uci.edu / ml / machine-learning-databases / wijnkwaliteit /

De volgende fout krijgen:

formula(formula, data = data) : 
  invalid model formula in ExtractVars

De volgende code gebruiken:

install.packages("rpart")
library("rpart")
# you'll need to change the following from windows to work on a linux box:
mydata <- read.csv(file="c:/Users/md7968/downloads/winequality-red.csv")
# grow tree 
fit <- rpart(YouSweetBoy ~ "residual sugar" + "citric acid", method = "class", data = mydata

Mind u dat ik heb gewijzigd van de scheidingstekens in het CSV-bestand naar komma’s.

Misschien is het de gegevens niet correct aan het lezen. Vergeef me, ik ben nieuw voor r en geen zeer goede programmeur.


Antwoord 1, Autoriteit 100%

Kijk naar names(mydata). Wanneer u een gegevens maakt. Frame, read.table()zal de “slechte” kolomnamen in goede worden. Je kunt (nou ja, niet) een ruimte in een kolomnaam hebben, zodat r-spaties in perioden wijzigt. Bovendien had u nooit snaren in een formule hebben genoteerd. Probeer

fit <- rpart(quality ~ residual.sugar + citric.acid, method = "class", data = mydata)

(Ik heb geen idee wat “YouSweetboy” zou moeten zijn, want dat was niet in de dataset, dus ik heb het veranderd op “kwaliteit”).


Antwoord 2, Autoriteit 25%

Verwijderen van de ruimte in onafhankelijke variabele namen en het uittrekken van de offertes maakte het aan het werk.

Gebruik in plaats van “restsuiker”, residuele_suiker


Antwoord 3

U kunt ook uw variabelenamen omwikkelen met “

Dus

`residual sugar`

Dit zou moeten werken:

fit <- rpart(quality ~ `residual sugar` + `citric acid`, method = "class", data = mydata)

Other episodes