Categories: Data

Microsoft stellt neue Analyse-Tools für Data Scientists vor

Microsoft stellt IDEAR (Interactive Data Exploration, Analysis and Reporting) und AMAR (the Automated Modelling and Reporting Tool) vor und weitet damit die Angebote für die Analyse großer Datenmengen aus.

Mit IDEAR automatisiert Microsoft das Erstellen von Reports in R. Über dieses Tool können Analysten Daten erkunden, visualisieren und interaktiv Auswerten. Dabei hilft auch das Shiny Library in R Studio. Wenn ein Daten-Analyst eine Visualisierung oder Abfrage gefunden hat, die als geeignet erscheint, lässt sich mit einem Mausklick Code das betreffende R-Scrip erstellt und über ein R-Log-File mit anderen teilen. Über die Funktion Generate Report erstellt dann das R Log-File den Report automatisch.

Die Visualisierung des neuen Microsoft-R-Tools IDEAR liefert eine 2-D- oder 3-D-Visualisierung, mit der sich Pattern oder Cluster in Datensätzen besser erkennen lassen. (Bild: Microsoft)
Die Visualisierung des neuen Microsoft-R-Tools IDEAR liefert eine 2-D- oder 3-D-Visualisierung, mit der sich Pattern oder Cluster in Datensätzen besser erkennen lassen. (Bild: Microsoft)

Darüber hinaus liefert das Tool eine Funktion für “Automatic Variable Type Detection”. Das sei, wie Microsoft mitteilt vor allem dann hilfreich, wenn viele verschiedene Datentypen ohne Informationen über Variablen vorliegen.

Mehr zum Thema

Wie man gefährliche E-Mails identifiziert

Gefälschte E-Mails enthalten häufig Viren oder andere Angreifer. Oft sollen auch private und sensible Daten gestohlen werden. Anhand weniger Kriterien lassen sich gefährliche E-Mails jedoch schnell erkennen.

IDEAR ermittelt dann automatisch die zugrunde gelegten Variablen. Die Ergebnisse werden dann an ein YAML-File geschickt, so dass die Analysten diese Variablen schrittweise nachbessern können.

Mit Variable Ranking und Target Leaker Identification lassen sich numerische und kategorische Variablen ranken. Target Leaker warnt den Anwender, wenn bestimmte Variablen einen Grenzwert überschreiten. Damit lässt sich auch feststellen, wie relevant Daten für Machine Learning sind.

In dem neuen Analytics-Tool AMAR können Variablen in verschiedenen Algorithmen getestet werden. (Bild: Microsoft)

IDEAR liefert auch eine Visualisierung, in der sich die Daten in 2- oder 3-D aus verschiedenen Perspektiven visualisieren lassen. Mit AMAR können Analysten die Mashine-Learning-Modelle trainieren, und die Relevanz verschiedener Modelle und der Variablen darin miteinander vergleichen. Die Tools sind über das GitHub-Repository von Microsofts Team Data Science Process verfügbar.

Redaktion

Recent Posts

GEBHARDT Intralogistics setzt bei IT-Transformation auf S/4HANA

Mit SAP S/4HANA und Cloud-Technologien legt der Intralogistik-Spezialist Basis für eine zukunftsweisende IT-Architektur.

2 Tagen ago

Elisabeth-Klinik Bigge setzt für Verwaltung von iPads auf Jamf Pro und Apple Business Manager

Automatisiertes Management von iPads sorgt für reibungslosen Betrieb sowie Sicherheit und verlässlichen Datenschutz.

2 Tagen ago

Malware Ranking Februar: AsyncRAT sorgt in Deutschland für wirtschaftliche Schäden

Der aufstrebende Trojaner wird in professionellen Kampagnen eingesetzt, die Plattformen wie TryCloudflare und Dropbox zur…

2 Tagen ago

KI-Wettrennen: Deutschland muss aufholen

Investitionsbemühungen der Unternehmen werden nur erfolgreich sein, wenn sie die Datenkomplexität, -sicherheit und -nachhaltigkeit bewältigen…

3 Tagen ago

Fakten statt Fiktion: Was tun gegen KI-Halluzinationen und -Bias?

Generative KI kann falsch liegen oder vorurteilsbehaftete Ergebnisse liefern. Maßnahmen, mit denen Unternehmen das Risiko…

3 Tagen ago

Deutsche Wirtschaft räumt Versäumnisse ein

82 Prozent der Unternehmen sind der Meinung, die aktuelle Konjunkturkrise sei auch eine Krise zögerlicher…

3 Tagen ago