Ausgezeichnete Arbeiten zur Informationsqualität – serie
Visar alla böcker i serien Ausgezeichnete Arbeiten zur Informationsqualität. Handla med fri frakt och snabb leverans.
5 produkter
5 produkter
724 kr
Skickas inom 10-15 vardagar
Informationsintegration in Biodatenbanken
Automatisches Finden von Abhängigkeiten zwischen Datenquellen
Häftad, Tyska, 2008
724 kr
Skickas inom 10-15 vardagar
1 103 kr
Skickas inom 10-15 vardagar
Modern enterprises have recently paid greater attention to data and information as a valuable strategic resource. The vast volumes of data currently being gen- ated as well as governance requirements, such as Sarbanes-Oxley, Basil II and other regulatory mandates, have made it imperative for organisations to pay - tention to the way that they govern and manage their IT resources in general, and data and information in particular. Furthermore, enterprises have realised that information is indeed one of their most valuable and strategic resources, and that through greater aggregation and analysis of data, improved business insight can lead to significantly greater competitive advantages. In this environment, with greater attention to information as a valuable - source and the continued voracious generation of data, information quality init- tives are now emerging as ‘must do’ projects, to address the questionable quality of information and thus decision making in contemporary enterprises. It is, h- ever, often assumed that a data quality initiative is a ‘once-off’ activity. Indeed, many organisations have difficulties deciding where to start and how to approach their data quality initiatives. This book provides a detailed guide for organisations to understanding the - sues of data quality as well as a toolset for measuring the data quality maturity and preparedness of their enterprise. This can then lead to a more effective init- tive for improving the level of data quality and thus enhancing the value of their precious information resources.
724 kr
Skickas inom 10-15 vardagar
693 kr
Skickas inom 10-15 vardagar
Duplikate bzw. Dubletten sind mehrere Datensätze, die das gleiche Realweltobjekt beschreiben, etwa mehrfach erfasste Kunden in einem CRM-System oder unterschiedliche Repräsentationen eines Produkts. Das Auffinden dieser Duplikate ist auch für moderne Computer eine komplexe und zeitintensive Aufgabe. Uwe Draisbach vergleicht zwei der einschlägigen Partitionierungsstrategien, die eine intelligente Auswahl von zu vergleichenden Datensatzpaaren treffen. Daraus entwickelt er ein verallgemeinertes Verfahren und zeigt, dass eine intelligente Auswahl der Datensatzpaare den Aufwand signifikant reduzieren kann, ohne die Qualität der Duplikaterkennung wesentlich zu verringern. Die Arbeit wurde mit dem „Information Quality Best Master Degree Award“ der Deutschen Gesellschaft für Informations- und Datenqualität ausgezeichnet.