Was für ein leidiges Thema. Seit Jahren versucht eBay mit unterschiedlichen Strategien einen vernünftigen Produktkatalog an den Start zu bringen und ist bisher kläglich gescheitert. Während die Wettbewerber wie Amazon an eBay mit Lichtgeschwindigkeit vorbeiziehen, bastelt eBay noch immer an einer Lösung. Nun soll gemeinsam mit Universitäten daran gearbeitet werden, die Herausforderung zu lösen.

In einer Pressemitteilungen beschreibt der Plattformbetreiber seine Initiative so:

Bei eBay verwenden wir hochmodernes maschinelles Lernen (ML), statistische Modellierung und Inferenz, Wissensdiagramme und andere fortschrittliche Technologien, um Geschäftsprobleme zu lösen, die mit massiven Datenmengen verbunden sind, von denen ein Großteil unstrukturiert und unvollständig in unser System gelangt und manchmal falsch ist. Zu den Anwendungsfällen gehören die Erweiterung und Rangfolge von Abfragen, Bilderkennung, Empfehlungen, Preisberatung, Betrugserkennung, maschinelle Übersetzung und vieles mehr.

„Gestern schrieb mich ein Käufer an, dass er den falschen Artikel erhalten hat. Laut Produktbeschreibung hätte der Artikel einen Holzgriff und ein Gürteletui wäre dabei. Ich schaue nach, indem ich den gekauften Artikel anklicke und siehe da: Über unserer Artikelbeschreibung erscheint ein Feld von eBay. Name, Modelnummer und EAN passen, aber bei „Besonderheiten“ steht: Holzgriff, Gürteletui. Ich hab das sofort geändert. Das ist wirklich schlecht von eBay bzw. dem System. So wird der Kunde in die Irre geführt und wir bekommen von dieser falschen Beschreibung gar nichts mit.Kann jemand was dazu sagen oder hat Tipps?“, beschwert sich aktuell ein Händler.

Obwohl die meisten der oben genannten Anwendungsfälle bei anderen Technologieunternehmen üblich sind, gibt es eine ganz besondere und einzigartige Herausforderung, die nur eBay betrifft – Sinn macht dies bei mehr als 1,3 Milliarden Einträgen, von denen viele unstrukturiert sind. Derzeit verwenden wir unsere internen Lösungen für maschinelles Lernen, um dieses Problem zu lösen. Wir möchten jedoch auch unsere Community und zukünftige Technologen erweitern, die keinen Zugriff auf diese Art von Daten hatten. Wir hoffen, dass die Zusammenarbeit mit Universitäten die akademische Neugier von ML weckt, die Forschung im E-Commerce-Bereich durch ein reales E-Commerce-Dataset anregt und uns dabei hilft, unsere Plattform zu verbessern.

Hinter diesem Link verstecken sich häufig fehlerhafte Produkt Daten

Um diese Idee zu unterstützen, veranstaltet eBay einen maschinellen Lernwettbewerb, um die Listungsdaten zu strukturieren, d.h. einen Produktkatalog zu erstellen. Wir freuen uns sehr, mit Studenten der folgenden Universitäten zusammenzuarbeiten (Liste unten), die nun eine Teilmenge unserer öffentlichen Listungsdaten verwenden können, um eine echte Herausforderung im Bereich E-Commerce zu lösen. Wir haben mehr als 40 Studenten von diesen Universitäten, die als Team oder in individueller Kapazität teilnehmen. Es gibt eine Reihe von Mannschaften aus:

  • NYU
  • Stanford
  • Universität in Buffalo
  • Universität von Texas in Dallas

Es gibt viele Datensätze, aber der Hauptschwerpunkt dieser waren Empfehlungssysteme, Preisschätzung, Bildverarbeitung, Verarbeitung natürlicher Sprache (Natural Language Processing, NLP) usw. Keiner war in Bezug auf die Zuordnung unstrukturierter Elemente zu gut katalogisierten Produkten so umfangreich. Wir nutzen die Open-Source-Plattform EvalAI, um die Herausforderung zu bewältigen. Unsere Hauptherausforderungsseite enthält alle relevanten Details.

Die Herausforderung

Die Frage, die wir beantworten möchten, ist, wie zwei oder mehr Einträge für dasselbe Produkt identifiziert werden können, indem sie derselben Gruppe zugeordnet werden. Wir nennen dies Product Level Equivalency (PLE). Das heißt, wenn ein Käufer zwei Artikel aus zwei verschiedenen Angeboten in einer einzigen Gruppe kauft und davon ausgeht, dass sich die Artikel in demselben Zustand befinden, würde er davon ausgehen, dass er zwei Exemplare desselben Produkts erhalten hat. Das messbare Ziel, die Bewertung, das Einreichungsformat und andere Details sind auf EvalAI verfügbar.

Der Datensatz

Der Datensatz besteht aus 1 Million ausgewählten öffentlichen Daten aus nicht gekennzeichneten Listen. 

Etwa 25.000 dieser Angebote werden von eBay nach menschlichem Ermessen geclustert („True Clustering“). Diese gruppierten Listings werden in drei Gruppen unterteilt: a) Validierungsset (ca. 12.500 Listings), b) Quizset (ca. 6.250 Listings), c) Final Submission Set (ca. 6.250 Listings).

Falsche Katalogdaten & Formatierung

Das Validierungsset soll den Teilnehmern die Bewertung ihres Ansatzes ermöglichen. Den Teilnehmern werden anonymisierte Kennungen und Cluster-Labels zur Verfügung gestellt. Die Quizdaten werden für die Ranglistenwertung verwendet. Der endgültige Einsendesatz wird verwendet, um den Gewinner zu bestimmen. Für das Quiz und den endgültigen Einreichungsdatensatz werden den Teilnehmern weder die Listen-IDs noch die Cluster-Labels zur Verfügung gestellt.

Zeitleiste

Die Herausforderung begann am 11. Oktober 2019. Die Partneruniversitätsteams können ihre Beiträge jederzeit über EvalAI einreichen. Die Auswertung und Ranglistenwertung beginnen am oder um den 8. November 2019. Der Wettbewerb läuft etwa fünf Monate und endet am oder um den 4. März 2020. Wir erwarten die Bekanntgabe des Gewinnerteams am 25. März 2020.

Preis

Studenten des Gewinnerteams wird ein Praktikum für Sommer 2020 bei eBay angeboten (vorbehaltlich der Überprüfung der Teilnahmeberechtigung). Das 12-wöchige Praktikum findet in der eBay-Zentrale in San Jose, CA, statt und wird inklusive möblierter Sommerunterkünfte vollständig bezahlt. Das Praktikumsprogramm von eBay ist eine Kombination aus echter Berufserfahrung und einem soliden Programm, mit dem Praktikanten mit verschiedenen Branchen, Führungskräften und Netzwerken vertraut gemacht werden. Das Praktikum ist auch eine hervorragende Gelegenheit für Studenten, ihre ML-Modelle in die Praxis umzusetzen.

Das Team dahinter

Von der Idee bis zur Kreation war diese Herausforderung eine völlig freiwillige Anstrengung von Menschen aus verschiedenen Disziplinen. Was als Flurgespräch begann, endete schließlich in einer kleinen Gruppe gleichgesinnter Enthusiasten. Wir bildeten ein Operating Committee (OC) und trafen uns wöchentlich, um Ideen für ein Brainstorming zu entwickeln. Allmählich wurden die Pläne in die Tat umgesetzt, und jetzt starten wir es. Es war eine unglaubliche Reise, und ich hatte das Glück, Teil des unten aufgeführten Teams zu sein, das es möglich gemacht hat.

  • Technik und Forschung: Roman Maslovskis, Uwe Mayer, Jean-David Ruvini, Anneliese Eisentraut, Akrit Mohapatra, Bennet Barouch, Pavan Vutukuru, Sathish Shanmugam und Jon Degenhardt
  • Programmverwaltung: Roya Foroud
  • Legal: Brian Haslam, Brad Sanders, Sonia Valdez und Kai Weingarten
  • Rekrutierung: Cindy Loggins
  • Kommunikation: Melissa Ojeda

Wir möchten uns auch beim EvalAI-Team für die schnelle Beantwortung unserer zahlreichen Fragen bedanken. Und zum Schluss ein Gruß an unsere oberste Führungsebene (Mohan Patt und Ron Knapp ), die diese Idee von Anfang an unterstützt haben. 

Wir hoffen aufrichtig, dass die Bereitstellung dieses realen Datensatzes Universitäten und Studenten dazu verleitet, sich weiter mit dem Bereich E-Commerce zu befassen und neue Ansätze zur Lösung komplexer Probleme zu entwickeln, die sich sowohl auf Kunden als auch auf Verkäufer positiv auswirken können.


Wenn Sie ein Student, Forscher oder Professor sind und gerne in zukünftigen Programmen teilnehmen würden, können Sie uns hier erreichen.

(Quelle: Mit Google Translate übersetze Pressemitteilung)

Der Ansatz ist eigentlich großartig, aber …

Allein der Glaube fehlt daran, dass dieser Ansatz eine bahnbrechende Lösung bei dem Bau eines guten Produktkatalogs bringen wird. Bereits seit 2009 arbeitet eBay an einem Produktkatalog. Im KFZ-Bereich durfte ich selbst Daten einliefern, jedoch war die Zusammenarbeit mit dem israelischen Team sehr herausfordernd. Ähnliches berichteten auch später (2017-2018) Händler, die in die Prozesse eingebunden worden sind. Was genau bei eBay schief läuft, erschließt sich nicht. Jedoch ist die Kritik am israelischen Team laut und deutlich zu hören.

Der jetzige Ansatz klingt vielversprechend, aber ob er erfolgreich umgesetzt werden kann, steht wohl in den Sternen. Denn so hat es meine Erfahrung gezeigt: Die Israelis sind verdammt lernresistent und verstehen es großartig, viel Budget erfolgreich in den Sand zu setzen.

Die Hoffnung stirbt zuletzt! (Aber sie stirbt)