PS CLEMENTINE PRO

Ein Werkzeug für Data Mining und Automatisierung

PS Clementine PRO bietet eine umfassende und universelle Lösung für Data-Mining-Analyse und -Automatisierung. Es unterstützt den gesamten Data-Mining-Prozess, von der Datenaufbereitung und -modellierung bis hin zur praktischen Anwendung der Modelle.

Die Data-Mining-Komponente basiert auf einem der am weitesten verbreiteten kommerziellen Data-Mining-Tools – IBM-SPSS-Modeler.

PS CLEMENTINE PRO BEINHALTET

Die Software besteht aus mehreren Komponenten.

IBM-SPSS-Modeler

Ein Data-Mining-Tool zur Datenfindung und Verarbeitung großer Datenmengen; es bietet Datenbankintegration, eine umfassende Suite von Machine-Learning-Techniken, überwachte und unüberwachte statistische Methoden sowie verschiedene Formen der Ergebnisvisualisierung.

PS Desktop

Eine Anwendung, die als Ausgangspunkt für den Zugriff auf verschiedene PS Clementine-Funktionalitäten oder andere PS (Predictive Solutions)-Produkte dient, wie zum Beispiel die Funktionen des statistischen Tools PS Imago PRO oder PS Quaestio zur Datenerfassung.

  • PS Clementine PRO
  • (vormals Manager)

Es ermöglicht die zentrale Verwaltung analytischer Aufgaben und steuert den Zugriff von Benutzern oder Benutzergruppen auf verschiedene Inhalte und Funktionen.

PS Clementine Repository

Ein leistungsfähiges Repository für analytische Assets und automatisierte Batch-Definitionen (bekannt als Jobs), das gleichzeitig deren Ausführung sicherstellt.

Datenaufbereitung und Datentransformationen

PS CLEMENTINE PRO beinhaltet das Data-Mining-Tool IBM-SPSS-Modeler. Dessen Funktionalität wurde durch zahlreiche Eingabe-, Verarbeitungs- und Terminalknoten erweitert, was eine optimierte Implementierung von REST- und SOAP-Webdiensten ermöglicht. Zu den weiteren Erweiterungen gehören eine einfachere Anbindung an die IBM SPSS Collaboration & Deployment Services-Umgebung sowie eine vereinfachte Handhabung von Variablennamen nach der Aggregation.

Konfigurieren Sie das Laden von Dateien mithilfe der hinzugefügten PS-Dateien-Funktionalität.

Massenhafte Umbenennung von Variablen, typischerweise nach der Verwendung von Aggregationsfunktionen.

Konfigurieren Sie die Kommunikation mit einem ausgewählten Webdienst mithilfe der REST-Technologie.

Modellierung und maschinelles Lernen

PS Clementine PRO bietet Dutzende von Algorithmen für maschinelles Lernen. Sie finden gängige Algorithmen wie die logistische Regression oder können sich für moderne Verfahren wie den XGBoost-Entscheidungswald entscheiden. Fertige Modelle lassen sich problemlos zu Ensembles kombinieren. Selbstverständlich kann die gesamte Lösung, einschließlich der Vorhersagemodelle, problemlos in operative Software exportiert werden.

Bayes'sche Netze bieten ein hochtransparentes multivariates statistisches Modell, das auf geschätzten bedingten Wahrscheinlichkeiten wichtiger Beziehungen zwischen Eingangs- und Ausgangsgrößen basiert.

Die Gaußsche Mischung stellt eine Alternative zu klassischen Clustering-Methoden wie K-Means oder Kohonen-Karten dar.

Entscheidungsbäume vereinen auf effektive Weise die Genauigkeit und Allgemeingültigkeit eines Vorhersagemodells. Ein sehr beliebter Algorithmus für Entscheidungsbäume ist XGBoost.

Berichterstellung und Visualisierung

Die Diagramme von PS Clementine PRO eignen sich sowohl für die Ergebnispräsentation als auch für laufende Ad-hoc-Analysen und die Generierung notwendiger Datenmanipulationen. Im Bearbeitungsmodus können Sie das Erscheinungsbild des Diagramms anpassen, während der Erkundungsmodus Werkzeuge zur Auswahl bestimmter Objekte im Diagramm und zur Generierung von Manipulationsknoten wie Selektionen, Kategorisierungen oder Ausgleichungen bietet.

Der beliebte Boxplot ermöglicht nicht nur die Identifizierung potenzieller Ausreißer, sondern bietet auch einen Vergleich der Verteilungen numerischer Variablen über verschiedene Untergruppen hinweg.

Im Bearbeitungsmodus lässt sich das Erscheinungsbild von Diagrammen ändern. Die intuitive Benutzeroberfläche ermöglicht es Ihnen, die Eigenschaften einzelner Objekte innerhalb des Diagramms anzupassen.

Daten zu Ländern, Städten, Straßen oder anderen Orten lassen sich am besten auf einem Kartenhintergrund darstellen. Sie können Karten farblich kennzeichnen, Markierungen ändern oder kleinen Diagrammen zu ausgewählten Koordinaten hinzufügen.

Automatisierung und Bereitstellung

Ein wesentlicher Mehrwert der PS Clementine PRO-Lösung liegt in der Möglichkeit, Analysedaten, insbesondere IBM SPSS Modeler-Datenströme, zu verwalten und zu automatisieren. Diese Datenströme werden in automatisierten Aufgaben (Jobs) verwendet. Jobs können automatisch oder ad hoc ausgelöst oder durch ein externes Ereignis – wie das Hinzufügen einer neuen Datei oder einen REST-/SOAP-Aufruf – gestartet werden.

Beispielhafte Definition von Datenströmen, die anschließend in zwei automatisierte Aufgaben (Jobs) unterteilt und sequenziell ausgeführt werden.

Management-Schnittstelle für die analytische Anlagenverwaltung und die automatisierte Aufgabendefinition mit Echtzeit-Auftragsstatusüberwachung und Ausführungshistorie.

Eine allgemeine Definition des PS-REST-Terminalknotens, der sicherstellt, dass eine REST-Nachricht an einen externen Prozess gesendet wird. Für die Jobautomatisierung kann auch der spezifische PS-Clementine-JOB-Knoten verwendet werden.

Zusätzliche Softwarefunktionen

Die Komponenten der Softwarelösung PS Clementine PRO erleichtern die Prozesse der Berichterstellung, Ergebnisverteilung und Automatisierung. Dazu gehört das Webtool PS Clementine PRO (vormals Manager), mit dem Benutzer Aufgaben aus mehreren Datenströmen erstellen, deren Ausführung definieren und die Verwaltung von Analyseaufgaben sowie den Benutzerzugriff sicherstellen können.

PS-Anwendungen in einer einzigen Schnittstelle

Zugriff und Steuerung aller Anwendungen (Statistik, Data Mining und Datenerfassung) über die einheitliche PS Desktop-Oberfläche.

Benutzerzugriff auf Inhalte

Innerhalb von PS Clementine Manager kann jeder Benutzer nur auf Inhalte zugreifen, diese bearbeiten oder ausführen, für die er die entsprechenden Berechtigungen und zugewiesenen Funktionen besitzt.

  • PS Clementine PRO
  • (vormals Manager)

Eine Anwendung, die die Ausführung aktiver analytischer Inhalte gewährleistet, die im PS Clementine Repository gespeichert sind.