SE::YouTube - een volwaardige YouTube scraper

Overzicht van de scraper
YouTube-zoekresultaten scraper. Dankzij de YouTube-scraper kunt u grote databases met videolinks verkrijgen, klaar voor verder gebruik. U kunt zoekopdrachten gebruiken in dezelfde vorm als u ze in de zoekbalk van YouTube invoert. Met de YouTube-scraper kunt u de belangrijkste gegevens van een video verzamelen in multithreading-modus. En voor het verkrijgen van volledige gegevens over elke video kunt u
SE::YouTube::Video gebruiken
De functionaliteit van A-Parser stelt u in staat om de instellingen van de YouTube-scraper op te slaan voor toekomstig gebruik (presets), een schema voor gegevensextractie in te stellen en nog veel meer. U kunt automatische query-vermenigvuldiging gebruiken, sub-query's uit bestanden invoegen, alfanumerieke combinaties en lijsten doorlopen om het maximaal mogelijke aantal resultaten te verkrijgen.
Het opslaan van resultaten is mogelijk in de vorm en structuur die u nodig heeft, dankzij de ingebouwde krachtige sjabloon-engine Template Toolkit waarmee u extra logica op de resultaten kunt toepassen en gegevens in verschillende formaten kunt uitvoeren, waaronder JSON, SQL en CSV.
Verzamelde gegevens
Gegevens worden verzameld van de service http://www.youtube.com/.
- Hoofdresultaten
- Link naar de video
- Titel van de video (title)
- Beschrijving van de video
- Gebruikersnaam
- Link naar de preview-afbeelding
- Aantal weergaven
- Lengte van de video
- Datum van toevoegen
- Aantal abonnees van het kanaal
- AI-beschrijving (summary), indien beschikbaar

- Array van "Gerelateerde zoekopdrachten"
- Trefwoord
- Link naar preview
Mogelijkheden
- Maximaal aantal pagina's voor gegevensextractie in Youtube - 50 pagina's
- Landkeuze van waaruit de zoekopdracht wordt uitgevoerd
- Zoeken op datum van toevoegen
- Keuze van resultaattype (video, kanalen, afspeellijsten)
- Keuze van de duur van de video
- Geavanceerde instelling van zoekparameters (ondertitels, 3D, HD, live, Creative Commons-licentie)
- Sort (Sortering) op relevantie, uploaddatum, beoordeling, aantal weergaven
- Scrapt aanvullend de link naar de video-preview
- Mogelijkheid om de interfacetaal te kiezen
- Mogelijkheid om de beveiligde modus voor zoeken in te schakelen
Toepassingen
- Zoeken, verzamelen en analyseren van informatie op Youtube
Query's
Als query's moeten zoektermen worden opgegeven, bijvoorbeeld:
Voetbal
Niagarawatervallen
Speak in english
Cats and dogs
Auto's
Query-substituties
U kunt ingebouwde macro's gebruiken voor query-vermenigvuldiging, bijvoorbeeld als we een zeer grote database met forums willen verkrijgen, geven we enkele basisquery's in verschillende talen op:
forum
forum
foro
In het query-formaat geven we een iteratie van tekens op van a tot zzzz, deze methode maakt het mogelijk om de zoekresultaten maximaal te roteren en veel nieuwe unieke resultaten te verkrijgen:
$query {az:a:zzzz}
Deze macro zal 475254 extra query's maken voor elke oorspronkelijke zoekopdracht, wat in totaal 4 x 475254 = 1901016 zoekopdrachten oplevert, een indrukwekkend getal, maar dit is absoluut geen probleem voor A-Parser. Bij een snelheid van 2000 query's per minuut wordt een dergelijke taak in slechts 16 uur verwerkt.
Opties voor resultaatweergave
A-Parser ondersteunt flexibele formattering van resultaten dankzij de ingebouwde sjabloon-engine Template Toolkit, waardoor resultaten in een willekeurige vorm kunnen worden uitgevoerd, evenals in gestructureerde vormen zoals CSV of JSON.
Export van een lijst met links
Links + videotitel + beschrijving met positieweergave
Resultaatformaat:
[% FOREACH item IN p1.serp; loop.count _ ' - ' _ item.link _ ' - ' _ item.title _ ' - ' _ item.desc _ "\n"; END %]
Voorbeeld van resultaat:
1 - https://www.youtube.com/watch?v=dm_T7H6J2U8 - HOE SLIM BEN JIJ? Eenvoudige test die veel volwassenen niet zullen halen - In deze video kun je testen hoe slim je bent. Er wacht een <b>test</b>, op je, bestaande uit eenvoudige schoolvragen ...
2 - https://www.youtube.com/watch?v=iDAYNEV9Kxg - Unieke Japanse test voor hersenveroudering! Controleer jezelf zeker! - Unieke Japanse <b>test</b> voor hersenveroudering! Controleer jezelf zeker! Deze <b>test</b> is ontwikkeld in Japan. Hoe ...
3 - https://www.youtube.com/watch?v=0PEy2_sSy6A - Deze eenvoudige test onthult je diepste verborgen angst - Ons onderbewustzijn is een vrij duistere plek, voor het begrijpen ervan zijn jarenlange psychoanalyse nodig. En deze ...
4 - https://www.youtube.com/watch?v=j6K9nIugzAY - India vs England 2nd Test Day 4 Highlights 2021| Royal Sports Tv - India vs England 2nd <b>Test</b> Day 4 Highlights 2021 India vs England 2nd <b>Test</b> Day 4 Highlights 2021 | ind vs eng <b>test</b> series India vs ...
5 - https://www.youtube.com/watch?v=ALDqwSMVYKQ - PSYCHOLOGISCHE TEST/ 929 SECONDEN LACHEN/BESTE GRAPPEN VAN FEBRUARI 2021 LACHEN/PROBEER NIET TE LACHEN! BEST COUB - Telegram-kanaal: https://t.me/CrazyHumor129k OP HET KANAAL VIND JE 929 SECONDEN UITSTEKEND LACHEN MET DE BESTE ...
6 - https://www.youtube.com/watch?v=6X1puBtvc_s - Serie Zwangerschapstest aflevering 1 - Russische serie 2015 HD - Première van de serie - <b>Test</b> op zwangerschap aflevering 1 - Russische serie 2015 Na de dood van een patiënte gynaecoloog Natalja ...
7 - https://www.youtube.com/watch?v=hXuhVD7Dwp0 - Test! Optische illusies die je een onverwachte waarheid over jezelf zullen onthullen! - <b>Test</b>! Optische illusies die je een onverwachte waarheid over jezelf zullen onthullen! Er zijn veel verschillende soorten ...
8 - https://www.youtube.com/watch?v=BYA8lY4o33A - Test! WELK DIER IS JOUW TALISMAN? Welk roofdier schuilt er in je ziel? Nauwkeurige karaktertest - <b>Test</b>! WELK GODDELIJK DIER BEN JIJ? Welk roofdier schuilt er in je ziel? Nauwkeurige <b>test</b> op karakter Voor dat ...
9 - https://www.youtube.com/watch?v=V-kqty2vAm4 - Test! IEMAND IS GEHEIM VERLIEFD OP JOU! ONTDEK WIE! - <b>Test</b>! IEMAND IS GEHEIM VERLIEFD OP JOU! ONTDEK WIE! Je voelt je vaak eenzaam en droomt ervan om echte te vinden ...
10 - https://www.youtube.com/watch?v=9HtbSe_oJto - Doe deze test en controleer je aandacht - In deze video testen we hoe ontwikkeld je aandacht is. Er wachten verschillende soorten opdrachten op je met meerdere niveaus ...
...
Uitvoer van links, titels en beschrijvingen in een CSV-tabel
De ingebouwde tool tools.CSVLine maakt het mogelijk om correcte tabeldocumenten te maken, klaar voor import in Excel of Google Sheets.
Algemeen resultaatformaat:
[% FOREACH i IN p1.serp; tools.CSVline(i.link, i.title, i.desc); END %]
Bestandsnaam:
$datefile.format().csv
Begintekst:
Link,Anker,Snippet
In het Algemeen resultaatformaat wordt de sjabloon-engine Template Toolkit gebruikt om de array $serp in een FOREACH-lus uit te voeren.
In de bestandsnaam van de resultaten hoeft u alleen de bestandsextensie te wijzigen naar csv.
Om de optie "Prepend text" beschikbaar te maken in de Taakeditor, moet u "More options" activeren. In "Prepend text" schrijven we de kolomnamen gescheiden door een komma en maken we de tweede regel leeg.
Trefwoordconcurrentie
Opslaan in SQL-formaat
Resultaatformaat:
[% FOREACH serp; "INSERT INTO serp VALUES('" _ query _ "', '"; link _ "', '"; title _ "')\n"; END %]
Voorbeeld van resultaat:
INSERT INTO serp VALUES('test', 'https://www.youtube.com/watch?v=dm_T7H6J2U8', 'HOE SLIM BEN JIJ? Eenvoudige test die veel volwassenen niet zullen halen')
INSERT INTO serp VALUES('test', 'https://www.youtube.com/watch?v=iDAYNEV9Kxg', 'Unieke Japanse test voor hersenveroudering! Controleer jezelf zeker!')
INSERT INTO serp VALUES('test', 'https://www.youtube.com/watch?v=0PEy2_sSy6A', 'Deze eenvoudige test onthult je diepste verborgen angst')
INSERT INTO serp VALUES('test', 'https://www.youtube.com/watch?v=BYA8lY4o33A', 'Test! WELK DIER IS JOUW TALISMAN? Welk roofdier schuilt er in je ziel? Nauwkeurige karaktertest')
INSERT INTO serp VALUES('test', 'https://www.youtube.com/watch?v=5Se6w0lOkyY', 'Nieuwe Renault Duster. Testrit. Anton Avtoman.')
INSERT INTO serp VALUES('test', 'https://www.youtube.com/watch?v=Ko8cFdoOV6U', 'Test! WAT VOOR MEISJE BEN JIJ? Wie zit er meer in je: een LADY of een TOMBOY?')
INSERT INTO serp VALUES('test', 'https://www.youtube.com/watch?v=j6K9nIugzAY', 'India vs England 2nd Test Day 4 Highlights 2021| Royal Sports Tv')
INSERT INTO serp VALUES('test', 'https://www.youtube.com/watch?v=9HtbSe_oJto', 'Doe deze test en controleer je aandacht')
INSERT INTO serp VALUES('test', 'https://www.youtube.com/watch?v=V-kqty2vAm4', 'Test! IEMAND IS GEHEIM VERLIEFD OP JOU! ONTDEK WIE!')
...
Dump resultaten naar JSON
Verwerking van resultaten
A-Parser maakt het mogelijk om resultaten direct tijdens de gegevensextractie te verwerken. In deze sectie hebben we de meest populaire cases voor de YouTube-scraper opgenomen.
Deduplicatie van links
Deduplicatie van links per domein
Domeinen extraheren
Tags verwijderen uit videotitels en beschrijvingen
Voeg Result Builders (Resultaatbouwer) toe en kies in de vervolgkeuzelijst de bron: $p1.serp.$i.title - Title. Kies type: Remove HTML tags.
Voeg opnieuw Result Builders (Resultaatbouwer) toe en kies in de vervolgkeuzelijst de bron: $p1.serp.$i.desc - Description. Kies type: Remove HTML tags.
Voorbeeld downloaden
Hoe een voorbeeld in A-Parser te importeren
eJyVVMtu2zAQ/BWBMJAGUI3k0ItujlsjLZw4tZ1D4fjASCuBDUWyJOXGEPTv3aVo
y07TQ2/kPmb2MWTLPHcv7sGCA+9YtmmZCWeWsdWXLPuhm3XzDMkSar2D5HZ9N088
r1xSWl0na+EluISrIvkMLrfCeKGVYykz3DqwBLg5xUFPASVvpGdpy/zeAPIgsLWi
IKco8G54BbluFMawHZcNxlx3/w4vta25x6ID6iGDjZDfjHvnh4uRp1KTj8mowEKf
ntTFJeu225T1eW4W4ijNXI/jBI7OFd/BWhOVkDCYZ3i753UgK7gH8h4IL8f+lRB4
UQiaCZc9A01kYH1U4lcoVmmMxaMV4GY4WTR5CABk3B+q27BRuDOEaELu9z6HZSWX
DlLmsNQZx0KKtx7hwXKv7SLuKGuZVhMp57ADOYQF/JtGyALXNykx6WtMfD9k8RdG
d2zvlAqX9ttiDUeUcLtZ3A1ZhZ7rCjsvnrFvKWrh8e6mQQkZu0LjC4A5zuyeZlZr
C0eaiBzZUdMGFClkWNnEDKazNs7WcmJsmdONzZFvc5VuGGkKU4OYGMknatKG53Hr
a0k7t5bv0XgIJuX0GaTi9/BIk/8FFxI6TMi1KkW1iE/i0Eaj1viqF2qqayOBhq4a
KVEzDpaDdicuaoQuw/TeJk8DRSCNLxdr0NJ9W/VzNFZgSZ/SWPUpa4TMuZSPy/mp
hw16D1p3BJvjI6o0ypvmHvSfsUrrKjw6eDX4zwAuz9sGui11H3+Z4+/Vnv01Wduh
qn66hz6KuqQYtOG4HEqG/pU/xum9JQ==
De resultaatbouwer kan zo vaak worden toegevoegd als u nodig heeft.
Zie ook: Resultaatbouwer
Filteren van links op basis van insluiting
Mogelijke instellingen
| Naam parameter | Standaardwaarde | Beschrijving |
|---|---|---|
| Device | Desktop | Keuze van type resultaten (Desktop/Mobile) |
| Pages count | 10 | Aantal pagina's voor gegevensextractie (van 1 tot 50) |
| Search from country | Auto (Based on IP) | Keuze van land van waaruit de zoekopdracht wordt uitgevoerd |
| Interface language | English | Keuze van interfacetaal |
| Restricted mode | ☐ | "Beveiligde modus" voor zoeken in-/uitschakelen |
| Uploaded time | All time | Zoeken op datum van toevoegen |
| Result type | Video | Keuze van resultaattype |
| Duration | All | Keuze van de duur van de video |
| Features | All | Geavanceerde instelling van zoekparameters |
| Sort by | Relevancy | Sortering van resultaten |
| Advanced filters (param sp=) | Hiermee kunt u complexe combinaties van filters opgeven. Hiervoor moet u de waarde van de parameter sp uit de URL in de browser nemen en in dit veld plakken. Deze waarde heeft voorrang op de filters die in de scraper-instellingen zijn opgegeven. |