Customer IT Support - Ticket Dataset

Customer IT Support - Ticket Dataset

Umfassendes synthetisches IT-Support-Ticket-Dataset mit 50.000 gelabelten E-Mail-Tickets inklusive Agenten-Antworten, Prioritäten, Queues und mehrsprachigem Support.

software-developmentdata-science

Author

Tobias Bueck

🔧 Synthetic IT Ticket Generator — Custom Dataset

Download Dataset on Kaggle →

Entdecke die erweiterte Version dieses Datasets mit 50.000 Ticket-Einträgen! Perfekt zum Trainieren von Modellen zur Klassifizierung und Priorisierung von Support-Tickets. Dieses Dataset enthält verschiedene Dateien mit unterschiedlichen Ticket-Anzahlen, Sprachen und Queue-Konfigurationen.

Hol dir eine On-Prem Ticket Tagging AI

Brauchst du eine On-Premises AI zur automatischen Ticket-Klassifizierung? Schau dir Open Ticket AI an — unsere Lösung für automatisierte Ticket-Klassifizierung, die in deiner eigenen Infrastruktur läuft.

Erstelle dein eigenes Custom Dataset

Möchtest du ein Dataset, das auf deine spezifischen Queues, Prioritäten und Sprachanforderungen zugeschnitten ist? Nutze unseren Synthetic Data Generation Service, um maßgeschneiderte Ticket-Daten ohne personenbezogene Informationen (PII) zu erstellen.

👉 Definiere deine Queues, Prioritäten und Sprachpräferenzen 👉 Generiere realistische Ticket-Daten für deinen spezifischen Use Case 👉 Trainiere Modelle auf Daten, die deinen Geschäftsanforderungen entsprechen

Übersicht

Das Customer IT Support Ticket Dataset ist eine umfassende Sammlung synthetischer E-Mail-Tickets, die zur Optimierung des Kundensupports, für NLP-Forschung und Machine-Learning-Projekte entwickelt wurde. Das Dataset bietet gut klassifizierte Daten mit vollständigen Ticket-Lebenszyklus-Informationen, einschließlich Kunden-E-Mails, Agenten-Antworten, Prioritäten, Queues, Typen, Tags und Geschäftskontext.

Dataset-Struktur

Das Dataset bietet eine detaillierte Struktur mit Klassifizierungen nach:

  • Abteilung/Queue: Wohin das Ticket weitergeleitet werden soll
  • Typ: Die Art des Tickets (Incident, Request, Problem, Change)
  • Priorität: Dringlichkeitsstufe (Low, Medium, Critical)
  • Sprache: Mehrsprachiger Support (EN, DE, ES, FR, PT)
  • Betreff & Body: Vollständiger E-Mail-Text von Kunden
  • Agenten-Antwort: Professionelle Antworten von Helpdesk-Agenten
  • Business Type: Kontext der Support-Organisation
  • Tags: Zusätzliche Kategorisierung für detaillierte Analysen

Features und Attribute

FeldBeschreibungBeispielwerte
🔀 QueueGibt die Abteilung an, an die das E-Mail-Ticket weitergeleitet wirdTechnical Support, Customer Service, Billing and Payments, Product Support, IT Support, Returns and Exchanges, Sales and Pre-Sales, Human Resources, Service Outages and Maintenance, General Inquiry
🚦 PriorityZeigt die Dringlichkeit und Wichtigkeit des Problems an🟢 Low, 🟠 Medium, 🔴 Critical
🗣️ LanguageSprache, in der die E-Mail verfasst istEN, DE, ES, FR, PT
📧 SubjectBetreffzeile der Kunden-E-MailVerschiedene Betreffzeilen von Kundenanfragen
📝 BodyVollständiger Textinhalt der Kunden-E-MailDetaillierte Kundenbeschreibungen
💬 AnswerAntwort des Helpdesk-AgentenProfessionelle Agenten-Antworten mit Lösungen
🏷️ TypeTicket-Typ, wie vom Agenten ausgewähltIncident, Request, Problem, Change
🏢 Business TypeDer Geschäftstyp des Support-HelpdesksTech Online Store, IT Services, Software Development Company
🏷️ TagsTags/Kategorien, die dem Ticket zugewiesen sind (10 Spalten)Software Bug, Warranty Claim, Password Reset, etc.

Queue (Abteilung)

Gibt die Abteilung an, in die das E-Mail-Ticket kategorisiert wird. Dies hilft bei der Weiterleitung des Tickets an das entsprechende Support-Team zur Lösung.

IconQueueBeschreibung
💻Technical SupportTechnische Probleme und Support-Anfragen
🈂️Customer ServiceKundenanfragen und Service-Anfragen
💰Billing and PaymentsAbrechnungsprobleme und Zahlungsabwicklung
🖥️Product SupportSupport für produktbezogene Probleme
🌐IT SupportInterne IT-Support- und Infrastrukturprobleme
🔄Returns and ExchangesProduktrückgaben und Umtausch
📞Sales and Pre-SalesVertriebsanfragen und Pre-Sales-Fragen
🧑‍💻Human ResourcesMitarbeiteranfragen und HR-bezogene Themen
Service Outages and MaintenanceDienstunterbrechungen und Wartung
📮General InquiryAllgemeine Anfragen und Informationsanfragen

Prioritätsstufen

Zeigt die Dringlichkeit und Wichtigkeit des Problems an. Hilft bei der Workflow-Verwaltung, indem Tickets priorisiert werden, die sofortige Aufmerksamkeit benötigen.

PrioritätStufeBeschreibungBeispiele
🟢1 (Low)Nicht dringende Probleme, die keine sofortige Aufmerksamkeit erfordernAllgemeine Anfragen, kleinere Unannehmlichkeiten, Routine-Updates, Feature-Requests
🟠2 (Medium)Mäßig dringende Probleme, die eine zeitnahe Lösung benötigen, aber nicht kritisch sindPerformance-Probleme, intermittierende Fehler, detaillierte Benutzerfragen
🔴3 (Critical)Dringende Probleme, die sofortige Aufmerksamkeit und schnelle Lösung erfordernSystemausfälle, Sicherheitsverletzungen, Datenverlust, größere Fehlfunktionen

Sprachunterstützung

Zeigt die Sprache an, in der die E-Mail verfasst ist. Nützlich für sprachspezifische NLP-Modelle und mehrsprachige Support-Analysen.

SprachcodeSpracheAnwendungsfall
enEnglischInternationaler Support, Hauptsprache
deDeutschDACH-Region Support
esSpanischSpanischsprachige Märkte
frFranzösischFranzösischsprachige Märkte
ptPortugiesischPortugiesischsprachige Märkte

Ticket-Typen

Verschiedene Ticket-Typen, kategorisiert, um die Art der Anfragen oder Probleme zu verstehen.

IconTypBeschreibung
IncidentUnerwartetes Problem, das sofortige Aufmerksamkeit erfordert
📝RequestRoutinemäßige Anfrage oder Service-Request
⚠️ProblemZugrundeliegendes Problem, das mehrere Incidents verursacht
🔄ChangeGeplante Änderung oder Update

Business Types

Der Geschäftstyp des Support-Helpdesks hilft, den Kontext des bereitgestellten Supports zu verstehen.

Beispiele sind:

  • Tech Online Store
  • IT Services
  • Software Development Company
  • SaaS Provider
  • E-commerce Platform
  • Enterprise IT Department

Tags und Kategorien

Tags/Kategorien, die dem Ticket zugewiesen sind, um häufige Probleme oder Themen weiter zu klassifizieren und zu identifizieren. Das Dataset enthält 10 Tag-Spalten für eine umfassende Kategorisierung.

Beispiel-Tags:

  • Product Support
  • Technical Support
  • Sales Inquiry
  • Software Bug
  • Warranty Claim
  • Password Reset
  • Network Issue
  • Account Management
  • Feature Request
  • Billing Question

Anwendungsfälle

AufgabeBeschreibung
TextklassifizierungTrainiere Machine-Learning-Modelle, um E-Mail-Inhalte genau in geeignete Abteilungen zu klassifizieren und so das Ticket-Routing und -Handling zu verbessern
PrioritätsvorhersageEntwickle Algorithmen, um die Dringlichkeit von E-Mails vorherzusagen und sicherzustellen, dass kritische Probleme umgehend behandelt werden
Kundensupport-AnalyseAnalysiere das Dataset, um Einblicke in häufige Kundenprobleme zu gewinnen, Support-Prozesse zu optimieren und die allgemeine Servicequalität zu verbessern
NLP-ModelltrainingBaue Natural Language Processing Modelle für Intent-Erkennung, Sentiment-Analyse und automatische Antwortgenerierung
QualitätssicherungTrainiere Modelle, um die Qualität und Konsistenz von Agenten-Antworten zu bewerten
Mehrsprachiger SupportEntwickle sprachspezifische Modelle oder teste mehrsprachige NLP-Ansätze
Agenten-TrainingNutze realistische Beispiele, um neue Support-Agenten in richtigen Antworttechniken zu schulen
ProzessoptimierungIdentifiziere Muster in der Ticket-Lösung, um Support-Workflows zu verbessern

Dataset-Statistiken

  • Gesamt-Tickets: 50.000+ Einträge über verschiedene Dateien hinweg
  • Sprachen: 5 (EN, DE, ES, FR, PT)
  • Queues: 10 verschiedene Abteilungen
  • Prioritätsstufen: 3 (Low, Medium, Critical)
  • Ticket-Typen: 4 (Incident, Request, Problem, Change)
  • Business Types: Mehrere Geschäftskontexte
  • Tags: Umfassende Kategorisierung mit 10 Tag-Spalten pro Ticket

Download und Zugriff

Network Diagram Tags

Das Dataset enthält Netzwerkdiagramm-Darstellungen, die Beziehungen zwischen verschiedenen Ticket-Attributen zeigen, und hilft so, die Interaktion von Queues, Prioritäten und Typen innerhalb des Support-Ökosystems zu visualisieren.

Warum dieses Dataset verwenden?

Synthetische Daten - Keine PII, völlig sicher für Training und Entwicklung ✅ Umfassend - Enthält den vollständigen Ticket-Lebenszyklus von der Kunden-E-Mail bis zur Agenten-Antwort ✅ Mehrsprachig - Unterstützung für 5 Sprachen ermöglicht internationale Anwendungen ✅ Realistisch - Generiert mit realistischen Geschäftsszenarien und Agenten-Antworten ✅ Flexibel - Mehrere Dateien mit verschiedenen Konfigurationen für verschiedene Anwendungsfälle ✅ Gut strukturiert - Sauberes, konsistentes Format, sofort einsatzbereit in ML-Pipelines

Erste Schritte

  1. Lade das Dataset von Kaggle herunter
  2. Wähle die Datei, die am besten zu deinen Bedürfnissen passt (Sprache, Größe, Queue-Konfiguration)
  3. Lade die Daten in dein bevorzugtes ML-Framework
  4. Beginne mit dem Training deiner Ticket-Klassifizierungsmodelle!

Für erweiterte Features wie benutzerdefinierte Queue-Definitionen, spezifische Business Types oder Integration in dein bestehendes Ticketing-System, schau dir Open Ticket AI an.

Unterstütze dieses Projekt

Deine Unterstützung durch ein Upvote auf Kaggle wäre sehr geschätzt! ❤️🙂 Danke, dass du hilfst, diese Ressource der Community zur Verfügung zu stellen.

Fazit

Das Customer IT Support Ticket Dataset ist eine unschätzbare Ressource für Unternehmen und Forscher, die datengetriebene Einblicke in den Kundensupport gewinnen möchten. Mit 50.000 Einträgen, mehrsprachigem Support, umfassender Tagging und realistischen Agenten-Antworten bietet dieses Dataset alles, was benötigt wird, um produktionsreife Ticket-Klassifizierungssysteme zu bauen.

Egal, ob du ML-Modelle trainierst, Support-Prozesse optimierst, NLP-Forschung betreibst oder automatisierte Support-Lösungen entwickelst — dieses Dataset bietet die Grundlage für deinen Erfolg.