Importy
Cesta: /{workspaceSlug}/import. Vstupní bod pro každý nový zdroj dat.
Podporované formáty
| Zdroj | Co to je | Plány |
|---|---|---|
| Soubor | Lokální upload (CSV, XLSX, JSONL) | všechny |
| URL feed | URL XML / CSV / JSONL feedu — Sytalog stáhne a zpracuje | všechny |
| Scrape | URL produktové stránky / kategorie e-shopu — Sytalog spustí Playwright scraper | Beta · jen Enterprise |
| XML dostupnost | Heureka-kompatibilní XML feed dostupnosti | placené plány |
| XML obrázky | Heureka-kompatibilní XML feed obrázků | placené plány |
Postup importu
- Pick source — soubor / URL / scrape.
- Preview columns — Sytalog detekuje sloupce; označíte, které importovat. UI ukáže „Vybráno X z Y sloupců".
- Pojmenování datasetu — placeholder „Stocks Q1".
- Start import — job se zařadí do fronty (RQ + Redis). Stránka přepne na live log.
- Progress: Discovered URLs (scrape), Detail queue / Processed / Saved / Skipped / Errors / Blocked (403/429/challenge), Estimated total, Job ID.
- Po dokončení:
success→ „Open created dataset" deeplink;finished_empty→ „Scraping completed, but no products were found" + hint. - Volitelně: stáhnout JSON report s plnou statistikou.
Limity velikosti souboru
| Formát | Náhled | Katalog | Provoz | Enterprise |
|---|---|---|---|---|
| CSV / XML / JSONL | 25 MB | 100 MB | 500 MB | 500 MB |
| XLSX | 10 MB | 25 MB | 50 MB | 50 MB |
Soubory větší než limit jsou odmítnuty během uploadu, ne ořezány. Sytalog neomezuje počet řádků — záleží jen na velikosti souboru.
Import XML feedu
- Bulk Import → URL feed → URL XML feedu → Sytalog detekuje strukturu, vyberete sloupce, spustíte.
- Pro dostupnostní XML (SKU → dostupnost / cena):
/{workspaceSlug}/import/xml→ XML dostupnost - Pro obrázkový XML (SKU → URL obrázku):
/{workspaceSlug}/import/xml→ XML obrázky
XML musí být veřejně dostupné (bez auth) a vrátit validní XML response.
Scraping (Enterprise · Beta)
Bulk Import → Scrape → URL produktové stránky / kategorie → pokročilá nastavení (max pages, max products) → spustit.
Sytalog používá Playwright pro JS rendering. Některé e-shopy mají anti-bot ochranu, která může způsobit finished_empty status. Kontaktujte podporu — pro Enterprise umíme přidat custom selektor.
Duplicate guard
- Nahrání stejného souboru / URL v posledních 15 minutách → modal „Source was uploaded recently. Yes, import again / Cancel".
- Dataset se stejným jménem → modal „Dataset already exists. Choose: Overwrite / Rename".
Mapování sloupců
Sytalog detekuje sloupce při importu automaticky — z hlavičky, vzorových hodnot a podle známých feedových formátů (Heureka aj.). UI ukáže „Detected N columns" a vy odznačíte ty, které nechcete.
Pro dataset update (aktualizace existujícího datasetu novým souborem) je auto-mapping ještě silnější — Sytalog navrhne páry „sloupec v datasetu ↔ sloupec ve feedu" a vy je upravíte ručně.