Iperso Un cabinet de consulting qui fait dans l'agenda setting

R et les logiciels de développement. Ça, c'est vraiment quand on passer de consommateurs à producteurs: https://www.face...
31/08/2025

R et les logiciels de développement. Ça, c'est vraiment quand on passer de consommateurs à producteurs:
https://www.facebook.com/100044308725646/posts/1304790297674582/?app=fbl

The “Climate Sensitive Infectious Disease” (CSID) Network looks to connect a global community of actors contributing towards impactful CSID software tools and establish localized CSID communities that can link existing on-the-ground issues and initiat...

Sept astuces sur    et   , à  savoir : https://www.facebook.com/share/178Y5pzwrC/
16/08/2025

Sept astuces sur et , à savoir : https://www.facebook.com/share/178Y5pzwrC/

Introduction When teaching, for my practicals/tutorials and for about half of my lectures I find myself preparing them using R Markdown and laterly Quarto. I enjoy preparing the material in R Markdown and Quarto because it gives me a reproducible way o...

*COMMENTAIRES DE QUELQUES PARTICIPANTS SESSION R 003, en présentiel* • Bonjour à tous , la formation était de taille L' ...
15/10/2024

*COMMENTAIRES DE QUELQUES PARTICIPANTS SESSION R 003, en présentiel*
• Bonjour à tous , la formation était de taille L' ambiance était au top avec l'esprit d'équipe
• Merci beaucoup pour l'esprit de partage exceptionnel
• Bonsoir j'ai été plus que satisfait de cette formation. L'ambiance et la pédagogie y étaient. Merci et bon vent au cabinet
• J'ai bcp apprécié, merci que Dieu vous bénisse
• Bonjour tout le monde j'espère que vous allez bien merci pour les différents partage et merci à monsieur Honko
• C'était vraiment une très belle journée de partage d'expériences, merci à tous les participants c'était comme si on se connaissait avant et encore merci à l'expert Honko pour sa disponibilité.R un jour, R pour toujours

Bonjour à toutes et à tous! Le samedi  12 octobre 2024, IPERSO a organisé une session de formation sur les méthodes stat...
14/10/2024

Bonjour à toutes et à tous! Le samedi 12 octobre 2024, IPERSO a organisé une session de formation sur les méthodes statistiques et leurs applications avec le logiciel statistiques R.La session a été animée par Monsieur BEMAHOUN Honko Roger, Statisticien-économiste/Directeur Général de IPERSO. La session a traité trois aspects:
1) la prise en main du langage R;
2) l'analyse statistique descriptive;
3) Tests statistiques et intervalle de confiance

DuckDB   dplyr,  ou R de base  ?"Pour une analyse simple (calcul de moyenne par groupe sur 100 millions de lignes), duck...
10/10/2024

DuckDB dplyr, ou R de base ?
"Pour une analyse simple (calcul de moyenne par groupe sur 100 millions de lignes), duckdb s'est révélé 125 fois plus rapide que R de base et 28 fois plus rapide que l'association readr+dplyr, tout en évitant le chargement des données du disque en mémoire. Le package duckplyr permet d'intégrer les techniques de traitement analytique de DuckDB dans une API compatible avec dplyr. Pour en savoir plus, consultez les sites duckdb.org/docs/api/r et duckplyr.tidyverse.org."
J'ai voulu me rendre compte par moi-même de l'intérêt que suscitait DuckDB. DuckDB est un moteur de requêtes SQL open-source, très performant et en cours de traitement, conçu spécifiquement pour les tâches analytiques. Souvent appelé « sqlite for analytics », DuckDB est optimisé pour les charges de travail OLAP (Online Analytical Processing) - les données sont organisées par colonnes, ce qui signifie que la base de données est optimisée pour une lecture rapide et des requêtes complexes et volumineuses qui impliquent des filtrages, des agrégations et des jointures. Il est « intégré » dans le même sens que sqlite - il n'a pas de dépendances externes, pas de serveur SGBD à installer, à configurer et à maintenir. Il ne s'agit pas d'un processus séparé - il s'exécute au sein d'un processus hôte, ce qui lui confère l'avantage d'un transfert de données à grande vitesse vers et depuis la base de données ou, dans certains cas, d'une interrogation directe des données sans avoir à importer ou à copier la moindre donnée. Pour en savoir plus, consultez le site duckdb.org/why_duckdb.
*DuckDB et R*
DuckDB dispose d'une API R (voir la documentation). Vous pouvez installer le paquetage duckdb à partir du CRAN ou de GitHub. Pourquoi voudriez-vous utiliser DuckDB dans R ?
Grands ensembles de données : Lorsque vous avez des données trop volumineuses pour la mémoire, DuckDB peut interroger efficacement les données à partir du disque sans avoir besoin de l'ensemble des données en mémoire.

• *Requêtes de type SQL :* Si vous êtes plus à l'aise avec le langage SQL, DuckDB vous permet d'exécuter des requêtes SQL directement sur vos cadres de données R. Vous pouvez effectuer des opérations complexes telles que le groupage de données, l'analyse de données et l'analyse de données. Vous pouvez effectuer des opérations complexes telles que le regroupement, le filtrage, la jonction et l'agrégation, en utilisant la syntaxe SQL familière. Là encore, sans jamais lire de données en mémoire dans R.
• *Requêtes analytiques efficaces :* Pour les charges de travail impliquant de grandes agrégations ou des requêtes sur des millions de lignes, DuckDB peut traiter de grandes requêtes analytiques tout en minimisant l'encombrement de la mémoire et en maintenant des performances élevées.
• Restez dans R ! L'utilisation de DuckDB dans R vous permet d'utiliser DuckDB pour les requêtes analytiques les plus lourdes, en vous restituant les résultats dans un tableau que vous pouvez utiliser pour la visualisation ou une analyse plus poussée.

Comparaison de DuckDB avec dplyr et base R
Je voulais me faire une idée de la rapidité de DuckDB par rapport à base R et dplyr. Il s'agit d'une expérience simple : Je simulerai des données et les écrirai sur le disque, puis j'utiliserai base R, dplyr et duckdb pour lire les données, les grouper par variable et calculer la moyenne de deux colonnes différentes. C'est simple. Il existe d'autres benchmarks plus performants ailleurs (par exemple, voir les articles d'Appsilon ici).
*Simulation des données*
Le code ci-dessous simule 100 millions de lignes et quelques valeurs et dates aléatoires.

*Fonctions de traitement des données*
Les trois fonctions ci-dessous prennent un chemin de fichier, lisent les données1, calculent la moyenne de la valeur1 et de la valeur2 groupées par identifiant, et renvoient une liste des résultats résumés et le temps nécessaire pour effectuer l'analyse.

*duckplyr*
La méthode DBI + dbConnect() + dbGetQuery() avec SQL n'est pas la plus ergonomique ni la plus idiomatique pour lire et analyser des données en R. Bonne nouvelle : le package duckplyr pour R intègre les techniques de traitement de requêtes analytiques de DuckDB dans une API compatible avec dplyr. Pour en savoir plus, consultez le site duckplyr.tidyverse.org.

Ici, j'utilise la fonction duckplyr_df_from_file() pour « lire » les données à partir d'un fichier, tandis que les méthodes summarize et arrange remplacent les fonctions de dplyr par la version de duckplyr. Cette opération prend également ~3 secondes, et est beaucoup plus facile à lire avec les outils dplyr auxquels vous êtes habitués. Jetez un coup d'œil à l'article de blog de DuckDB sur duckplyr pour bien comprendre comment cela fonctionne.
*Aller plus loin*
Le « benchmark » ici était simple et limité, et je l'ai surtout utilisé comme une excuse pour en apprendre un peu plus sur duckdb et sur la façon de l'intégrer dans mon flux de travail. Dans ce benchmark, je n'ai pas essayé de séparer le temps passé à lire les données en mémoire du temps passé à les traiter, et l'« analyse » était une simple moyenne par groupe. Je n'ai pas essayé de paralléliser ou d'optimiser les approches de base de R ou de dplyr, et je n'ai rien fait avec data.table.

Pour des benchmarks plus complets, je recommande la lecture de quelques posts récents d'Appsilon sur l'utilisation de duckdb en R, pour les données volumineuses, et avec Shiny :
*R Dplyr ou DuckDB*
« R One Billion Row Challenge » : R est-il une option viable pour analyser d'énormes ensembles de données (en anglais)
*R Shiny et DuckDB*
Il y a aussi quelques présentations de la conférence posit::conf(2023) de l'année dernière sur l'utilisation de R avec DuckDB. Ces présentations sont disponibles sur YouTube.
*Stephen Turner.2024. _DuckDB vs dplyr vs base R_; R-bloggers*
_

*Shiny Assistant : Créez des applications Shiny avec l'aide de GPT et GenerativeAI*Vous vous êtes parfois posez la quest...
20/09/2024

*Shiny Assistant : Créez des applications Shiny avec l'aide de GPT et GenerativeAI*
Vous vous êtes parfois posez la question de l’élaboration d’un tableau de bord. Non seulement R, le fait avec , en sus, de le rendre inter-actif via le package Shiny.Comme à leurs habitudes, les développeurs R sont dans la tendance .Près de deux ans se sont écoulés depuis la première version de ChatGPT. Le monde a été pris d'assaut, c'est le moins que l'on puisse dire. Dans la courte période qui a suivi, nous avons maintenant de nombreuses entreprises qui construisent des plateformes d'IA générative qui étaient inimaginables avant la fin de l'année 2022. C'est une période formidable pour les utilisateurs. Pour être plus précis, l'assistant est construit sur un grand modèle de langage spécialisé dans le codage Shiny, R et Python, ce qui vous permet de créer des applications, de déboguer, de refactoriser le code et de basculer entre Shiny pour R et Python.
*Qu'est-ce que le Shiny Assistant et pourquoi s'en préoccuper ?*
‍Quelle est la qualité de Shiny Assistant dans la phase actuelle de bêta fermée ? Rejoignez-nous dans la construction d'une application complète pour le découvrir. Peu importe que vous préfériez R ou Python, l'assistant peut travailler avec les deux. Gardez simplement à l'esprit que Shiny pour Python est environ dix ans plus jeune que son équivalent R, de sorte que la qualité et la variété des réponses peuvent ne pas être au même niveau.

*Statistiques globales*
Le premier composant d'interface utilisateur que nous voulons construire est un ensemble de statistiques globales.
C'est assez basique, certes, mais cela vous donnera une idée de la manière dont Shiny Assistant travaille avec l'agrégation de données.
*Dario,R.2024. Introducing Shiny Assistant – You Can Now Build Shiny Applications with GPT and GenerativeAI, R-bloggers*

SESSION DE FORMATION  R 003Apprenez par la pratique avec R ! Au cours de cette formation, vous mettrez en œuvre les conc...
16/09/2024

SESSION DE FORMATION R 003
Apprenez par la pratique avec R ! Au cours de cette formation, vous mettrez en œuvre les concepts théoriques à travers des projets concrets. Des exercices pratiques et des études de cas vous permettront de maîtriser rapidement les outils de la data science. Devenez autonome dans vos analyses et exploitez pleinement le pouvoir de R. Réjoignez-nous sans plus tarder, en vous inscrivant ici : https://forms.gle/PztzbGBtkze7uLYC9

Bonjour à toutes et  à tous! IPERSO organise les 10 et 11 octobre 2024(en présentiel ), et 16 et 17 octobre2024(en ligne...
11/09/2024

Bonjour à toutes et à tous! IPERSO organise les 10 et 11 octobre 2024(en présentiel ), et 16 et 17 octobre2024(en ligne), une session de formation sur le language de programmation statistique R. Le thème de la session: Analyse descriptive en R : Méthodes et applications

Formater des dates Excel dans R:
06/02/2024

Formater des dates Excel dans R:

Introduction Have you ever battled with Excel’s quirky date formats in your R projects? If so, you’re not alone! Those cryptic numbers can be a real headache, but fear not, fellow R warriors! Today, we’ll conquer this challenge and transform tho...

Adresse

Somgande

Heures d'ouverture

Lundi 09:00 - 17:00
Mardi 09:00 - 17:00
Mercredi 09:00 - 17:00
Jeudi 09:00 - 17:00
Vendredi 09:00 - 17:00
Samedi 09:00 - 17:00
Dimanche 09:00 - 17:00

Téléphone

+22674566734

Notifications

Soyez le premier à savoir et laissez-nous vous envoyer un courriel lorsque Iperso publie des nouvelles et des promotions. Votre adresse e-mail ne sera pas utilisée à d'autres fins, et vous pouvez vous désabonner à tout moment.

Contacter L’organisation

Envoyer un message à Iperso:

Partager