Figure 16 – uploaded by Laure Berti-Equille

Contents

Figure 1.1: Taxonomy of Existing Techniques for Entity Resolution

Based on the online study of Galhardas*, Table 1.5 presents the research proto- types and open source systems developed for data cleaning, data preparation and analysis.

Contents

Figure 2.2: Relational Metamodel of CRM_DB

Figure 2.6: Example of Analytic Workflow for QoD evaluation of CRM_DB

Table 2.14: Assigning Probabilities to QoD Dimension for a DB Object Instance

Figure 2.7: Syntax of Quality Contract Type Creation  2.7. EXTENDING THE SYNTAX OF A QUERY LANGUAGE

Figure 2.8: Syntax of Call Specification in Quality Contract Type Declaration  2.7. EXTENDING THE SYNTAX OF A QUERY LANGUAGE

2.7. EXTENDING THE SYNTAX OF A QUERY LANGUAGE

Figure 2.12: Quality-Extended Query Processing

3.2. DATA QUALITY AWARENESS FOR KDD PROCESS

Figure 3.4: Decision Areas for Rule Post-Selection

Figure 3.6: Decision Costs for Rule Selection with Different Data Quality Variations without Misclassification for the a Priori Probability 7° = 0.200

Figure 3.7: Amplitude of Cost Variations Depending on Data Quality Variations without Misclassification for the a priori Probability 7° = 0.200

Figure 3.12: Decision Status on Rule Selection for Data Quality Variations with Misclassification for 7° = 0.200

Contents