Productgegevens zijn niet altijd beschikbaar, volledig en/of correct. Niet elke leverancier heeft de capaciteit, focus en/of middelen om productgegevens van hoge kwaliteit aan te leveren. Als gevolg hiervan gaan inkomsten verloren door ontbrekende of onjuiste gegevens of is er veel handwerk vereist om de productinformatie aan te vullen en te corrigeren.
Hoe lossen wij dit op?
Squadra Machine Learning Company heeft verschillende algoritmen ontwikkeld die productgegevens automatisch kunnen verrijken en/of verbeteren. De volgende algoritmen zijn beschikbaar:
Scraping
We zijn in staat om websites van leveranciers en PDF bestanden te scrapen, relevante productkenmerken van producten automatisch te vinden en deze om te zetten naar de juiste standaarden. Op deze manier kunnen productgegevens worden verrijkt of kunnen problemen met de gegevenskwaliteit worden gedetecteerd met beperkte handmatige interventie.
Feature-extractie – op tekst gebaseerd
Gegevens over productkenmerken (features) zijn mogelijk niet altijd beschikbaar in een gestructureerd formaat, maar zijn soms wel opgenomen in een productbeschrijving of ERP-tekst. Met onze geavanceerde feature-extractie algoritmen kunnen deze ‘verborgen’ productkenmerken worden gebruikt en onttrokken. En dat alles met minimale handmatige interventie.
Feature-extractie – gebaseerd op afbeeldingen
Soms zijn gegevens over productkenmerken niet beschikbaar in een gestructureerd formaat, maar wel zichtbaar in productafbeeldingen. Met onze geavanceerde functie-extractie algoritmen kunnen deze visuele productkenmerken automatisch worden gebruikt en onttrokken met minimale handmatige interventie.
Gegevenskwaliteit: deduplicatie en fuzzy matching
Productgegevenssets kunnen dubbele gegevens bevatten: vergelijkbare productkenmerkdata in meerdere kolommen, meerdere regels voor dezelfde of nauw verwante producten, soms verkeerd gespeld of met typfouten. Onze algoritmen kunnen deze problemen met de gegevenskwaliteit detecteren en soms zelfs automatisch corrigeren.