Je construis une trame Big Data en fusionnant le contenu de quelques fichiers ensemble. Ces fichiers partagent la même disposition de colonnes.
c = read.delim ('bigfile1.txt') c1 = read.delim ('bigfile2.txt') c2 = read.delim ('bigfile3 .txt ') ctmp1 = merge (c, c1, all = TRUE) ctmp2 = merge (ctmp1, c2, all = TRUE)
Le code ci-dessus est-il efficace?
Dois-je réutiliser le même nom de variable à la place, par exemple
tmp = merge (c, c1, all = TRUE) tmp = merge (tmp, c2, all = TRUE)