Les outils de Data Wrangling

3 Fév

Plusieurs outils spécialisés sont disponibles pour le Data Wrangling, mais il y en a peu qui sont gratuits présentement.

Il y a Trifacta qui est fait partie des leaders présentement, mais l’outil est limité à un fichier de 100Mo. Il y a Talend qui offre le Data Preparation Free Desktop, une version gratuite comme le nom l’indique. La version la plus récente (2.1) est quand même assez complète, plus évoluée que la première mouture. Pour l’instant, je suis en phase de test, mais je n’ai pas été en mesure de l’essayer dans une situation réelle de travail. Enfin, on retrouve OpenRefine, un logiciel à l’origine développé par Google, mais maintenant en Open Source. La question se posait à savoir si le logiciel allait être mis à jour, et effectivement, la mise à jour la plus récente date de novembre 2017. La communauté semble donc toujours active. Enfin, il y aurait un projet chez Microsoft concernant un outil de Data Wrangling, connu pour l’instant sous le nom de Pendleton. Vous trouverez plus d’information concernant ce logiciel dans l’article “Microsoft aims to take the work out of data wrangling with coming ‘Pendleton’ tool”.

Voici deux articles pour ceux qui cherche un outil de data wrangling : Seven Free Data Wrangling Tools et 18 Free Exploratory Data Analysis Tools For People who don’t code so well.

Laisser un commentaire

Votre adresse de messagerie ne sera pas publiée. Les champs obligatoires sont indiqués avec *