PS CLEMENTINE PRO
Ein Werkzeug für Data Mining und Automatisierung
PS Clementine PRO bietet eine umfassende und universelle Lösung für Data-Mining-Analyse und -Automatisierung. Es unterstützt den gesamten Data-Mining-Prozess, von der Datenaufbereitung und -modellierung bis hin zur praktischen Anwendung der Modelle.
Die Data-Mining-Komponente basiert auf einem der am weitesten verbreiteten kommerziellen Data-Mining-Tools – IBM-SPSS-Modeler.
PS CLEMENTINE PRO BEINHALTET
Die Software besteht aus mehreren Komponenten.
IBM-SPSS-Modeler
PS Desktop
- PS Clementine PRO
- (vormals Manager)
PS Clementine Repository
Datenaufbereitung und Datentransformationen
PS CLEMENTINE PRO beinhaltet das Data-Mining-Tool IBM-SPSS-Modeler. Dessen Funktionalität wurde durch zahlreiche Eingabe-, Verarbeitungs- und Terminalknoten erweitert, was eine optimierte Implementierung von REST- und SOAP-Webdiensten ermöglicht. Zu den weiteren Erweiterungen gehören eine einfachere Anbindung an die IBM SPSS Collaboration & Deployment Services-Umgebung sowie eine vereinfachte Handhabung von Variablennamen nach der Aggregation.
Massenhafte Umbenennung von Variablen, typischerweise nach der Verwendung von Aggregationsfunktionen.
Modellierung und maschinelles Lernen
PS Clementine PRO bietet Dutzende von Algorithmen für maschinelles Lernen. Sie finden gängige Algorithmen wie die logistische Regression oder können sich für moderne Verfahren wie den XGBoost-Entscheidungswald entscheiden. Fertige Modelle lassen sich problemlos zu Ensembles kombinieren. Selbstverständlich kann die gesamte Lösung, einschließlich der Vorhersagemodelle, problemlos in operative Software exportiert werden.
Bayes'sche Netze bieten ein hochtransparentes multivariates statistisches Modell, das auf geschätzten bedingten Wahrscheinlichkeiten wichtiger Beziehungen zwischen Eingangs- und Ausgangsgrößen basiert.
Die Gaußsche Mischung stellt eine Alternative zu klassischen Clustering-Methoden wie K-Means oder Kohonen-Karten dar.
Berichterstellung und Visualisierung
Die Diagramme von PS Clementine PRO eignen sich sowohl für die Ergebnispräsentation als auch für laufende Ad-hoc-Analysen und die Generierung notwendiger Datenmanipulationen. Im Bearbeitungsmodus können Sie das Erscheinungsbild des Diagramms anpassen, während der Erkundungsmodus Werkzeuge zur Auswahl bestimmter Objekte im Diagramm und zur Generierung von Manipulationsknoten wie Selektionen, Kategorisierungen oder Ausgleichungen bietet.
Der beliebte Boxplot ermöglicht nicht nur die Identifizierung potenzieller Ausreißer, sondern bietet auch einen Vergleich der Verteilungen numerischer Variablen über verschiedene Untergruppen hinweg.
Im Bearbeitungsmodus lässt sich das Erscheinungsbild von Diagrammen ändern. Die intuitive Benutzeroberfläche ermöglicht es Ihnen, die Eigenschaften einzelner Objekte innerhalb des Diagramms anzupassen.
Automatisierung und Bereitstellung
Ein wesentlicher Mehrwert der PS Clementine PRO-Lösung liegt in der Möglichkeit, Analysedaten, insbesondere IBM SPSS Modeler-Datenströme, zu verwalten und zu automatisieren. Diese Datenströme werden in automatisierten Aufgaben (Jobs) verwendet. Jobs können automatisch oder ad hoc ausgelöst oder durch ein externes Ereignis – wie das Hinzufügen einer neuen Datei oder einen REST-/SOAP-Aufruf – gestartet werden.
Beispielhafte Definition von Datenströmen, die anschließend in zwei automatisierte Aufgaben (Jobs) unterteilt und sequenziell ausgeführt werden.
Management-Schnittstelle für die analytische Anlagenverwaltung und die automatisierte Aufgabendefinition mit Echtzeit-Auftragsstatusüberwachung und Ausführungshistorie.
Zusätzliche Softwarefunktionen
Die Komponenten der Softwarelösung PS Clementine PRO erleichtern die Prozesse der Berichterstellung, Ergebnisverteilung und Automatisierung. Dazu gehört das Webtool PS Clementine PRO (vormals Manager), mit dem Benutzer Aufgaben aus mehreren Datenströmen erstellen, deren Ausführung definieren und die Verwaltung von Analyseaufgaben sowie den Benutzerzugriff sicherstellen können.











