Przejdź do treści głównej

Lista terminów

Scraper

Scraper - to skrypt, który zbiera dane z określonych zasobów internetowych na podstawie podanych zapytań, przetwarza je i wyświetla wynik w formacie domyślnym lub określonym przez użytkownika.

Wbudowane scrapery

Wbudowane scrapery - to fabrycznie zainstalowane scrapery, dostępne od samego początku, których funkcjonalność jest stale utrzymywana.

Klienckie scrapery JS

Klienckie scrapery JS - to scrapery z otwartym kodem źródłowym, napisane w języku JavaScript i dostępne w Edytorze scraperów JS, które można eksportować i importować wraz z zadaniem. Przykłady takich scraperów można znaleźć w Katalogu scraperów i presetów.

Preset

Preset - to zarówno zapisane zadanie, które tworzy się w Edytorze zadań poprzez wybór zestawu scraperów, ustawień i opcji do wykonania zadania, jak i ustawienia pojedynczego scrapera (preset ustawień).

Ustawienia scrapera

Ustawienia scrapera - to opcje, które mogą być edytowane lub zmieniane (nadpisywane) dla innego algorytmu pracy scrapera, aby uzyskać niestandardowy wynik.

Zapisane zadanie

Zapisane zadanie - to preset, który został zapisany i może być użyty ponownie.

Konfiguracja wątków

Konfiguracja wątków - to zestaw ustawień wątków, który można zapisać pod nazwą i wielokrotnie wykorzystywać z różnymi presetami.

Wątki

Wątki - to wiele jednocześnie uruchomionych do scrapowania kontekstów, w których scraper równolegle wykonuje zapytania, przełącza proxy według określonej strategii zdefiniowanej w Konfiguracji wątków i loguje proces wykonywania scrapowania dla każdego zapytania.

Proxychecker

Proxychecker - to kontroler odpowiedzialny za ładowanie i sprawdzanie proxy, wykorzystujący zestaw ustawień proxycheckera.

Proxy

Proxy - to ciąg znaków/tablica ciągów o określonym formacie (lub link do nich), który pozwala ukryć rzeczywisty adres IP poprzez wysyłanie zapytań podczas scrapowania i przesyłanie pakietów danych od serwera do klienta za pomocą pośredniczącego serwera proxy.

Szablon wyniku

Szablon wyniku - to szablon, który określa format i zbierane dane wynikowe, zdefiniowane bezpośrednio lub za pomocą wbudowanego silnika szablonów Template Toolkit.