Question:
De SAS à R - quels sont les packages "indispensables" pour la création de rapports
Dominic Comtois
2014-11-09 14:56:41 UTC
view on stackexchange narkive permalink

Un gros avantage de SAS par rapport à R est sans doute sa capacité à produire des rapports assez complexes avec peu d'instructions; pensez à PROC SUMMARY ou PROC TABULATE par exemple.

Mon cœur va à R en raison de son ouverture et de sa communauté dynamique. Mais je dois admettre que les PROCS de SAS sont assez puissants prêts à l'emploi. Pour résoudre partiellement ces problèmes, j'ai écrit un package R intitulé summarytools qui fournit des moyens de générer des rapports simples (fréquences, statistiques univariées, livre de codes, pour l'essentiel) à différents formats comme RTF, pdf et markdown.

Cependant, même avec l'utilisation de by () pour stratifier les statistiques (que ce soit des fréquences ou des statistiques numériques univariées), je pense que je suis encore loin de générer des tables aussi flexibles et complètes comme avec PROC TABULATE ou PROC MEANS . Ma question est donc la suivante: quels packages R trouvez-vous "incontournables" pour les besoins d'extraction de statistiques essentielles à partir de dataframes, de division sur cette variable et de filtrage sur cette autre. J'espère que cette question n'est pas jugée trop large; J'ai fait mes devoirs et essayé de trouver la réponse à cette question avant de poster ici. Je suis sûr qu'il existe des packages vraiment très bien conçus qui résolvent ces problèmes, et je ne les ai tout simplement pas vus ... Donc, si je peux demander, attendez un jour ou deux avant de mettre le verrou sur celui-ci. ;)

Toute contribution est la bienvenue!

Cheers

Je pense que les rapports SAS sont inférieurs aux Rs, il vous suffit de trouver les bons packages et les fonctions à utiliser.J'utilise les packages tableone, Hmisc, sjPlot pour ces tâches.
J'aime beaucoup l'approche sjPlot car elle donne des résultats absolument magnifiques sans avoir à passer par des étapes supplémentaires.
Deux réponses:
Frank Harrell
2014-11-09 19:28:14 UTC
view on stackexchange narkive permalink

Le problème avec R est qu'il y a tellement de façons de construire de bons rapports, et tellement de packages R qui sont utiles pour cette tâche. Une approche, bien que désuète, est présentée dans http://biostat.mc.vanderbilt.edu/wiki/pub/Main/StatReport/summary.pdf. Notez que certaines des fonctions ont été mises à jour comme indiqué dans http://biostat.mc.vanderbilt.edu/HmiscNew [et prenez vraiment note de la fonction tabulr ] . Cette approche tourne autour de $ \ LaTeX $, et je pense que vous constaterez que pour la production de tableaux avancés (y compris ceux contenant des micrographies et des notes de bas de page), $ \ LaTeX $ présente de nombreux avantages par rapport à l'approche markdown-pandoc .

Mais je pense que nous devrions remplacer presque tous les tableaux par des graphiques. Le nouveau package R greport ("rapport graphique") reprend la philosophie selon laquelle les graphiques doivent être utilisés pour la présentation principale, et les graphiques doivent être liés par un lien hypertexte vers les tableaux de support qui apparaissent dans une annexe du rapport PDF. Voir http://biostat.mc.vanderbilt.edu/Greport. greport utilise de nouvelles fonctions dans le package Hmisc pour représenter graphiquement des données catégorielles (c'est-à-dire traduire des tableaux en graphiques) et pour afficher des distributions entières de variables continues.

Je vais examiner «greport», merci.L'avenue tout graphique semble en effet prometteuse.J'ai également trouvé que `gplots`,` sjPlot` (comme mentionné par @Adam Robinson) et `gridExtra` fournissent tous des fonctions qui génèrent des tableaux graphiques.
Karolis Koncevičius
2014-11-10 17:04:15 UTC
view on stackexchange narkive permalink

Il semble que le reporting et le filtrage / fractionnement des données par variables soient deux tâches orthogonales. Et les gens utilisent généralement des packages différents pour ceux-ci.

Pour gérer les données, il existe peu de packages vraiment populaires: dplyr et data.table .

Pour les tableaux de rapports, un package qui me démarque est stargazer

Voici quelques démonstrations: http://cran.r-project.org/ web / packages / stargazer / vignettes / stargazer.pdf

Il couvre à la fois latex et html (et ASCII, mais pas utilisé).

Je n'ai jamais utilisé SAS donc je ne sais pas si cela couvrira toutes les fonctionnalités que vous vouliez.

Je connais bien les outils existants pour manipuler les données.Je vais regarder dans stargazer, merci pour la suggestion.
Stargazer est sympa, mais je préfère Tableone car il fournit des fonctionnalités similaires pour les résultats de régression (fonction ShowRegTable) mais aussi les tables de base (fonction CreateTableOne).J'ai parfois obtenu des intervalles de confiance quelque peu différents dans stargazer, par rapport au package utilisé pour calculer les estimations ponctuelles.C'est bien cependant qu'il fournit l'AIC, les observations utilisées, etc.
Je n'ai pas utilisé tableone, mais après un rapide coup d'œil, il semble qu'il s'agisse davantage d'obtenir des tables elles-mêmes, tandis que stargazer consiste davantage à exporter ces tables au format html / latex avec des styles prédéfinis.Il peut être possible d'utiliser tableone pour obtenir la table et stargazer pour l'exporter vers des documents.comme `stargazer (ShowRegTable (obj))`
Comme Frank l'a dit, il y a tellement de façons possibles de réaliser de grandes choses avec R. Je pense toujours que l'avenue ascii + markdown a beaucoup à offrir pour peu d'investissement.Mais j'apprécie votre contribution et je continuerai d'expérimenter.


Ce Q&R a été automatiquement traduit de la langue anglaise.Le contenu original est disponible sur stackexchange, que nous remercions pour la licence cc by-sa 3.0 sous laquelle il est distribué.
Loading...