Customer IT Support - Ticket Dataset

Customer IT Support - Ticket Dataset

Umfassender synthetischer IT-Support-Ticket-Datensatz mit 50.000 gelabelten E-Mail-Tickets, inklusive Agenten-Antworten, Prioritäten, Queues und mehrsprachiger Unterstützung.

software-developmentdata-science

Author

Tobias Bueck

🔧 Synthetischer IT-Ticket-Generator — Benutzerdefinierter Datensatz

Datensatz auf Kaggle herunterladen →

Entdecken Sie die erweiterte Version dieses Datensatzes mit 50.000 Ticket-Einträgen! Perfekt geeignet, um Modelle für die Klassifizierung und Priorisierung von Support-Tickets zu trainieren. Dieser Datensatz enthält verschiedene Dateien mit unterschiedlicher Anzahl an Tickets, Sprachen und Queue-Konfigurationen.

Holen Sie sich eine On-Prem Ticket-Tagging AI

Benötigen Sie eine On-Premises AI zur automatischen Klassifizierung von Tickets? Schauen Sie sich Open Ticket AI an — unsere Lösung für automatisierte Ticket-Klassifizierung, die in Ihrer eigenen Infrastruktur läuft.

Erstellen Sie Ihren eigenen benutzerdefinierten Datensatz

Möchten Sie einen Datensatz, der genau auf Ihre spezifischen Queues, Prioritäten und Sprachanforderungen zugeschnitten ist? Nutzen Sie unseren Synthetic Data Generation Service, um benutzerdefinierte Ticket-Daten ohne personenbezogene Daten (PII) zu erstellen.

👉 Definieren Sie Ihre Queues, Prioritäten und Sprachpräferenzen 👉 Generieren Sie realistische Ticket-Daten für Ihren spezifischen Anwendungsfall 👉 Trainieren Sie Modelle mit Daten, die Ihren geschäftlichen Anforderungen entsprechen

Übersicht

Der Customer IT Support Ticket Dataset ist eine umfassende Sammlung synthetischer E-Mail-Tickets, die zur Optimierung des Kundensupports, für NLP-Forschung und Machine Learning-Projekte entwickelt wurde. Der Datensatz bietet gut klassifizierte Daten mit vollständigen Informationen zum Ticket-Lebenszyklus, einschließlich Kunden-E-Mails, Agenten-Antworten, Prioritäten, Queues, Typen, Tags und geschäftlichem Kontext.

Datensatz-Struktur

Der Datensatz bietet eine detaillierte Struktur mit Klassifizierungen nach:

  • Abteilung/Queue: Wohin das Ticket weitergeleitet werden soll
  • Typ: Die Art des Tickets (Incident, Request, Problem, Change)
  • Priorität: Dringlichkeitsstufe (Low, Medium, Critical)
  • Sprache: Mehrsprachige Unterstützung (EN, DE, ES, FR, PT)
  • Betreff & Text: Vollständiger E-Mail-Text der Kunden
  • Agenten-Antwort: Professionelle Antworten von Helpdesk-Agenten
  • Geschäftstyp: Kontext der Support-Organisation
  • Tags: Zusätzliche Kategorisierung für detaillierte Analysen

Funktionen und Attribute

FeldBeschreibungBeispielwerte
🔀 QueueGibt die Abteilung an, an die das E-Mail-Ticket weitergeleitet wirdTechnical Support, Customer Service, Billing and Payments, Product Support, IT Support, Returns and Exchanges, Sales and Pre-Sales, Human Resources, Service Outages and Maintenance, General Inquiry
🚦 PrioritätGibt die Dringlichkeit und Wichtigkeit des Anliegens an🟢 Low, 🟠 Medium, 🔴 Critical
🗣️ SpracheSprache, in der die E-Mail verfasst istEN, DE, ES, FR, PT
📧 BetreffBetreffzeile der Kunden-E-MailVerschiedene Betreffzeilen für Kundenanfragen
📝 TextVollständiger Textinhalt der Kunden-E-MailDetaillierte Kundenbeschreibungen
💬 AntwortAntwort des Helpdesk-AgentenProfessionelle Agenten-Antworten mit Lösungen
🏷️ TypTicket-Typ, wie vom Agenten ausgewähltIncident, Request, Problem, Change
🏢 GeschäftstypDer Geschäftstyp des Support-HelpdesksTech Online Store, IT Services, Software Development Company
🏷️ TagsTags/Kategorien, die dem Ticket zugewiesen sind (10 Spalten)Software Bug, Warranty Claim, Password Reset, etc.

Queue (Abteilung)

Gibt die Abteilung an, in die das E-Mail-Ticket kategorisiert wird. Dies hilft bei der Weiterleitung des Tickets an das entsprechende Support-Team zur Lösung.

IconQueueBeschreibung
💻Technical SupportTechnische Probleme und Support-Anfragen
🈂️Customer ServiceKundenanfragen und Service-Anfragen
💰Billing and PaymentsAbrechnungsprobleme und Zahlungsabwicklung
🖥️Product SupportSupport für produktbezogene Probleme
🌐IT SupportInterner IT-Support und Infrastrukturprobleme
🔄Returns and ExchangesProduktrückgaben und Umtausch
📞Sales and Pre-SalesVerkaufsanfragen und Pre-Sales-Fragen
🧑‍💻Human ResourcesMitarbeiteranfragen und HR-bezogene Themen
Service Outages and MaintenanceServiceunterbrechungen und Wartung
📮General InquiryAllgemeine Anfragen und Informationswünsche

Prioritätsstufen

Gibt die Dringlichkeit und Wichtigkeit des Anliegens an. Hilft bei der Verwaltung des Workflows durch Priorisierung von Tickets, die sofortige Aufmerksamkeit erfordern.

PrioritätStufeBeschreibungBeispiele
🟢1 (Low)Nicht dringende Probleme, die keine sofortige Aufmerksamkeit erfordernAllgemeine Anfragen, kleinere Unannehmlichkeiten, Routine-Updates, Feature-Requests
🟠2 (Medium)Mäßig dringende Probleme, die zeitnah gelöst werden müssen, aber nicht kritisch sindPerformance-Probleme, sporadische Fehler, detaillierte Benutzerfragen
🔴3 (Critical)Dringende Probleme, die sofortige Aufmerksamkeit und schnelle Lösung erfordernSystemausfälle, Sicherheitsverletzungen, Datenverlust, größere Fehlfunktionen

Sprachunterstützung

Gibt die Sprache an, in der die E-Mail verfasst ist. Nützlich für sprachspezifische NLP-Modelle und Analysen zur mehrsprachigen Unterstützung.

SprachcodeSpracheAnwendungsfall
enEnglischInternationaler Support, Hauptsprache
deDeutschSupport für die DACH-Region
esSpanischSpanischsprachige Märkte
frFranzösischFranzösischsprachige Märkte
ptPortugiesischPortugiesischsprachige Märkte

Ticket-Typen

Verschiedene Ticket-Typen, die kategorisiert wurden, um die Art der Anfragen oder Probleme zu verstehen.

IconTypBeschreibung
IncidentUnerwartetes Problem, das sofortige Aufmerksamkeit erfordert
📝RequestRoutineanfrage oder Service-Anfrage
⚠️ProblemZugrunde liegendes Problem, das mehrere Incidents verursacht
🔄ChangeGeplante Änderung oder Update

Geschäftstypen

Der Geschäftstyp des Support-Helpdesks hilft dabei, den Kontext des bereitgestellten Supports zu verstehen.

Beispiele sind:

  • Tech Online Store
  • IT Services
  • Software Development Company
  • SaaS Provider
  • E-commerce Platform
  • Enterprise IT Department

Tags und Kategorien

Tags/Kategorien, die dem Ticket zugewiesen wurden, um Probleme oder Themen weiter zu klassifizieren und zu identifizieren. Der Datensatz enthält 10 Tag-Spalten für eine umfassende Kategorisierung.

Beispiel-Tags:

  • Product Support
  • Technical Support
  • Sales Inquiry
  • Software Bug
  • Warranty Claim
  • Password Reset
  • Network Issue
  • Account Management
  • Feature Request
  • Billing Question

Anwendungsfälle

AufgabeBeschreibung
TextklassifizierungTrainieren Sie Machine Learning-Modelle, um E-Mail-Inhalte präzise in die entsprechenden Abteilungen zu klassifizieren und so das Ticket-Routing zu verbessern
PrioritätsvorhersageEntwickeln Sie Algorithmen zur Vorhersage der Dringlichkeit von E-Mails, um sicherzustellen, dass kritische Probleme zeitnah bearbeitet werden
Kundensupport-AnalyseAnalysieren Sie den Datensatz, um Erkenntnisse über häufige Kundenprobleme zu gewinnen, Support-Prozesse zu optimieren und die Servicequalität zu steigern
NLP-ModelltrainingErstellen Sie Natural Language Processing-Modelle für Intent-Erkennung, Sentiment-Analyse und automatisierte Antwortgenerierung
QualitätssicherungTrainieren Sie Modelle zur Bewertung der Qualität und Konsistenz von Agenten-Antworten
Mehrsprachiger SupportEntwickeln Sie sprachspezifische Modelle oder testen Sie mehrsprachige NLP-Ansätze
Agenten-TrainingNutzen Sie realistische Beispiele, um neue Support-Agenten in korrekten Antworttechniken zu schulen
ProzessoptimierungIdentifizieren Sie Muster bei der Ticket-Lösung, um Support-Workflows zu verbessern

Datensatz-Statistiken

  • Gesamtanzahl Tickets: 50.000+ Einträge in verschiedenen Dateien
  • Sprachen: 5 (EN, DE, ES, FR, PT)
  • Queues: 10 verschiedene Abteilungen
  • Prioritätsstufen: 3 (Low, Medium, Critical)
  • Ticket-Typen: 4 (Incident, Request, Problem, Change)
  • Geschäftstypen: Mehrere geschäftliche Kontexte
  • Tags: Umfassende Kategorisierung mit 10 Tag-Spalten pro Ticket

Download und Zugriff

Netzwerkdiagramm-Tags

Der Datensatz enthält Netzwerkdiagramm-Darstellungen, die Beziehungen zwischen verschiedenen Ticket-Attributen zeigen und dabei helfen, zu visualisieren, wie Queues, Prioritäten und Typen innerhalb des Support-Ökosystems interagieren.

Warum diesen Datensatz verwenden?

Synthetische Daten - Keine PII, absolut sicher für Training und Entwicklung ✅ Umfassend - Enthält den gesamten Ticket-Lebenszyklus von der Kunden-E-Mail bis zur Agenten-Antwort ✅ Mehrsprachig - Unterstützung für 5 Sprachen ermöglicht internationale Anwendungen ✅ Realistisch - Generiert mit realistischen Geschäftsszenarien und Agenten-Antworten ✅ Flexibel - Mehrere Dateien mit unterschiedlichen Konfigurationen für verschiedene Anwendungsfälle ✅ Gut strukturiert - Sauberes, konsistentes Format, bereit für den sofortigen Einsatz in ML-Pipelines

Erste Schritte

  1. Laden Sie den Datensatz von Kaggle herunter
  2. Wählen Sie die Datei, die am besten zu Ihren Anforderungen passt (Sprache, Größe, Queue-Konfiguration)
  3. Laden Sie die Daten in Ihr bevorzugtes ML-Framework
  4. Beginnen Sie mit dem Training Ihrer Ticket-Klassifizierungsmodelle!

Für fortgeschrittene Funktionen wie benutzerdefinierte Queue-Definitionen, spezifische Geschäftstypen oder die Integration in Ihr bestehendes Ticket-System, schauen Sie sich Open Ticket AI an.

Unterstützen Sie dieses Projekt

Ihre Unterstützung durch einen Upvote auf Kaggle wäre sehr willkommen! ❤️🙂 Vielen Dank, dass Sie dazu beitragen, diese Ressource der Community zur Verfügung zu stellen.

Fazit

Der Customer IT Support Ticket Dataset ist eine wertvolle Ressource für Unternehmen und Forscher, die datengesteuerte Erkenntnisse im Kundensupport nutzen möchten. Mit 50.000 Einträgen, mehrsprachiger Unterstützung, umfassender Tagging-Struktur und realistischen Agenten-Antworten bietet dieser Datensatz alles, was für den Aufbau produktionsreifer Ticket-Klassifizierungssysteme erforderlich ist.

Egal, ob Sie ML-Modelle trainieren, Support-Prozesse optimieren, NLP-Forschung betreiben oder automatisierte Support-Lösungen entwickeln – dieser Datensatz bildet das Fundament für Ihren Erfolg.