Un gros avantage de SAS par rapport à R est sans doute sa capacité à produire des rapports assez complexes avec peu d'instructions; pensez à PROC SUMMARY
ou PROC TABULATE
par exemple.
Mon cœur va à R en raison de son ouverture et de sa communauté dynamique. Mais je dois admettre que les PROCS de SAS sont assez puissants prêts à l'emploi. Pour résoudre partiellement ces problèmes, j'ai écrit un package R intitulé summarytools qui fournit des moyens de générer des rapports simples (fréquences, statistiques univariées, livre de codes, pour l'essentiel) à différents formats comme RTF, pdf et markdown.
Cependant, même avec l'utilisation de by () pour stratifier les statistiques (que ce soit des fréquences ou des statistiques numériques univariées), je pense que je suis encore loin de générer des tables aussi flexibles et complètes comme avec PROC TABULATE
ou PROC MEANS
. Ma question est donc la suivante: quels packages R trouvez-vous "incontournables" pour les besoins d'extraction de statistiques essentielles à partir de dataframes, de division sur cette variable et de filtrage sur cette autre. J'espère que cette question n'est pas jugée trop large; J'ai fait mes devoirs et essayé de trouver la réponse à cette question avant de poster ici. Je suis sûr qu'il existe des packages vraiment très bien conçus qui résolvent ces problèmes, et je ne les ai tout simplement pas vus ... Donc, si je peux demander, attendez un jour ou deux avant de mettre le verrou sur celui-ci. ;)
Toute contribution est la bienvenue!
Cheers