Samenvoegen r brengt fout ‘door’ moet uniek geldige kolommen specificeren

R mag me vandaag niet…

Ik heb twee tabellen samengesteld via cbind(). Tabblad 1 (dwd_nogap) is

 x1                 col1_x1       col2_x1      
A "1982 12 01 00:00" "        0.4" "          0"
B "1982 12 02 00:00" "       -0.5" "          0"
C "1982 12 03 00:00" "       -0.2" "          0"
D "1982 12 04 00:00" "         -1" "        0.1"
E "1982 12 05 00:00" "       -0.9" "          0"
F "1982 12 06 00:00" "        3.7" "        4.1"

Tabblad 2 (dwd_gap) is:

    x2                 col1_x2       col2_x2      
[1,] "1982 12 01 00:00" "        0.4" "          0"
[2,] "1982 12 03 00:00" "       -0.2" "          0"
[3,] "1982 12 04 00:00" "         -1" "        0.1"
[4,] "1982 12 05 00:00" "       -0.9" "          0"
[5,] "1982 12 06 00:00" "        3.7" "        4.1"
[6,] "1982 12 07 00:00" "          7" "        5.8"

Mijn samenvoegopdracht is:

exporttab <- merge(x=dwd_nogap,y=dwd_gap,by.x=dwd_nogap[,1],by.y=dwd_gap[,1], fill=-9999)

Naar mijn mening is het commando correct, maar het werkt blijkbaar niet goed…

Error in fix.by(by.x, x) : 'by' must specify uniquely valid columns

Antwoord 1, autoriteit 100%

Geef liever de namen van de kolom waarop u wilt samenvoegen:

exporttab <- merge(x=dwd_nogap, y=dwd_gap, by.x='x1', by.y='x2', fill=-9999)

Antwoord 2, autoriteit 4%

Dit is wat ik heb geprobeerd voor een rechter outer join [volgens mijn vereiste]:

m1 <- merge(x=companies, y=rounds2, by.x=companies$permalink, 
            by.y=rounds2$company_permalink, all.y=TRUE)
# Error in fix.by(by.x, x) : 'by' must specify uniquely valid columns
m1 <- merge(x=companies, y=rounds2, by.x=c("permalink"), 
            by.y=c("company_permalink"), all.y=TRUE)

Dit werkte.

LEAVE A REPLY

Please enter your comment!
Please enter your name here

Other episodes