Télécharger la liste

Description du projet

DataCleaner is a data quality analysis tool that allows you to perform data profiling, validating, and minor ETL-like tasks. These activities help you administer and monitor your data quality in order to ensure that your data is useful and applicable to your business situation. It can be used for master data management (MDM) methodologies, data warehousing projects, statistical research, preparation for extract-transform-load activities, and more.

Système requise

System requirement is not defined
Information regarding Project Releases and Project Resources. Note that the information here is a quote from Freecode.com page, and the downloads themselves may not be hosted on OSDN.

2013-01-22 21:29
3.1.2

Un service Web a été ajouté à l'application de surveillance permettant d'obtenir une valeur métrique (liste des). La composante « Recherche de Table » a été améliorée en ajoutant une propriété configurable sémantique de jointure. Les composants de EasyDQ ont été améliorés, ajoutant encore des options de configuration et une interface plus riche de résultat déduplication. Améliorations des performances ont été une attention particulière de ce communiqué. Améliorations ont été apportées dans le moteur de DataCleaner, d'autres utilisent une approche de traitement en continu dans certaines situations, qui ne répondait pas auparavant.
Tags: Minor feature enhancements, Minor bugfixes
A Web service was added to the monitoring application for getting a (list of) metric values. The 'Table lookup' component has been improved by adding join semantics as a configurable property. The EasyDQ components have been upgraded, adding further configuration options and a richer deduplication result interface. Performance improvements have been a specific focus of this release. Improvements have been made in the engine of DataCleaner to further utilize a streaming processing approach in certain corner cases which was not covered previously.

2013-01-05 06:50
3.1.1

La date et l'heure des options d'analyse ont été agrandies, ajoutant des analyseurs de distribution pour les numéros de semaine, les mois et années. Une option facultative « statistiques descriptives » a été ajoutée à l'analyseur de nombre et de l'analyseur de Date/heure des lignes dans les graphiques de chronologie de l'application Web surveillance ont maintenant des petits points en eux. Deux nouveaux transformateurs ont été ajoutés pour générer l'UUID et pour générer des horodatages. Maintenant les requêtes ad hoc peuvent contenir des clauses distinctes, *-des caractères génériques et les sous-requêtes et sont tolérants aux panne problèmes de casse du texte.
Tags: Minor feature enhancements
The date and time related analysis options have been expanded, adding distribution analyzers for week numbers, months, and years. An optional "descriptive statistics" option has been added to the Number analyzer and the Date/time analyzer The lines in the timeline charts of the monitoring Web application now have small dots in them. Two new transformers have been added for generating UUIDs and for generating timestamps. Now ad hoc queries can contain DISTINCT clauses, *-wildcards, and subqueries, and are fault-tolerant towards text-case issues.

2012-12-18 12:20
3.1

Indicateurs de qualité de données définissables maintenant sous forme de formules (expressions mathématiques), pas simplement cru métriques.
Il est maintenant possible de tirer les requêtes SQL ad hoc vers toutes les banques de données (DB, CSV, Excel et plus encore). Une nouvelle option d'analyse, l'outil de recherche de valeur, a été ajoutée. Avec cette analyse, il est facile d'identifier des valeurs inattendues dans un champ. Gestion des travaux, y compris la copie et de suppression d'emplois, on a beaucoup plus facile en exposant la fonctionnalité directement dans l'interface utilisateur. Il a été possible de modifier les mesures de qualité de données historiques afin de repositionner les résultats dans la chronologie.
Data Quality KPIs can now be defined as formulas (mathematical expressions), not just raw metrics.
It is now possible to fire ad-hoc SQL queries towards all datastores (DB, CSV, Excel, and more). A new analysis option, the Value matcher, was added. With this analysis, it's easy to identify unexpected values in a field. Management of jobs, including copying and deleting jobs, has been made a lot easier by exposing the functionality directly in the UI. It has been made possible to change historic data quality metrics in order to reposition results into the timeline.

2012-01-03 11:15
2.4.1

Cette version ajoute des corrections de bogues mineures, des améliorations de performances et quelques nouvelles fonctionnalités. Parmi les plus importants sont performance de chargement par lots grandement amélioré, un menu commode de « écrire les données » dans la fenêtre principale, double-cliquez sur renommer des composants de l'emploi, syntaxe de coloration dans le transformateur de Javascript et filtre et correctifs pour un éventuel blocage lors du démarrage de l'application.
Tags: Minor feature enhancements, Minor bugfixes
This release adds minor bugfixes, performance improvements, and a few new features. Among the important ones are greatly-improved batch loading performance, a convenient "write data" menu in the main window, double-click renaming of job components, syntax coloring in the Javascript transformer and filter, and fixes for a potential deadlock when starting the application.

2011-12-15 07:54
2.4

Soutien pour les bases de données MongoDB, tous deux pour lire et écrivent des opérations. Intégration avec EasyDQ.com, qui fournit des fonctions de client DQ dans le nuage. Dupliquer la détection (aka. Déduplication des / Fuzzy matching) analyseurs. Un composant « lookup Table » pour faire des recherches de valeurs multiples d'une table. Un composant « Insérer dans la table » pour insérer des enregistrements dans tout type de table (par exemple les tables de base de données, CSV fichiers, feuilles Excel ou MongoDB collections). Variables de niveau d'emploi qui permettent de modulation emplois qui peuvent être instrumentés de la ligne de commande.
Tags: Major feature enhancements, mongodb, ETL, xml. lookup, customer data
Support for MongoDB databases, both for read and write operations. Integration with EasyDQ.com, which provides Customer DQ functions in the cloud. Duplicate detection (aka. Deduplication / Fuzzy matching) analyzers. A "Table lookup" component for doing lookups of multiple values from a table. An "Insert into table" component for inserting records into any kind of table (e.g. database tables, CSV files, Excel sheets, or MongoDB collections). Job-level variables which allow for parameterizable jobs that can be instrumented from the command line.

Project Resources