Ga naar de hoofdinhoud

GooglePlay::Apps - Scraper voor Google Play-apps

Overzicht van de scraper

Overzicht van de scraperGooglePlay::AppsGooglePlay::Apps – verzamelt gegevens over applicaties uit Google Play. Geautomatiseerde verzameling van alle gegevens: naam, beoordeling, auteur, beschrijving, link naar de app en prijs.

U kunt automatische query-multiplicatie, substitutie van subquery's uit bestanden, het doorlopen van alfanumerieke combinaties en lijsten gebruiken om het maximaal mogelijke aantal resultaten te verkrijgen. Door gebruik te maken van resultaatfiltering kunt u het resultaat direct opschonen door alle ongewenste ruis te verwijderen (met behulp van uitsluitingswoorden).

De functionaliteit van A-Parser stelt u in staat om de instellingen voor gegevensextractie van de GooglePlay::Apps scraper op te slaan voor toekomstig gebruik (presets), extractieschema's in te stellen en nog veel meer.

Het opslaan van resultaten is mogelijk in de vorm en structuur die u nodig heeft, dankzij de ingebouwde krachtige sjabloon-engine Template Toolkit, waarmee u extra logica op de resultaten kunt toepassen en gegevens in verschillende formaten kunt uitvoeren, waaronder JSON, SQL en CSV.

Use cases voor de scraper

Verzamelde gegevens

Gegevens worden verzameld van de service play.google.com

Verzamelde gegevens
  • Naam
  • Beoordeling
  • Beschrijving
  • Link naar de app
  • Prijs
  • Aantal downloads
  • Genre van de app

Mogelijkheden

  • Keuze van het land van waaruit de zoekopdracht wordt uitgevoerd
  • Keuze van de taal van de resultatenpagina
  • Zoeken op prijs (Gratis of Betaald)
  • Zoeken op beoordeling (Alle of hoger dan 4+)

Toepassingen

  • Gegevensextractie van app-gegevens uit Google Play

Query's

Als query's moeten zinnen worden opgegeven waarmee in GooglePlay wordt gezocht, bijvoorbeeld:

hartslagmeter

Query-substituties

U kunt ingebouwde macro's gebruiken voor de automatische substitutie van subquery's uit bestanden. Als we bijvoorbeeld aan elke query een lijst met andere woorden willen toevoegen, geven we enkele basisquery's op:

fantasy
tower defense
rpg

In het query-formaat geven we de macro op voor de substitutie van extra woorden uit het bestand keywords.txt. Deze methode stelt u in staat de variatie van query's aanzienlijk te vergroten:

{subs:keywords} $query 

Deze macro zal voor elke oorspronkelijke zoekopdracht evenveel extra query's maken als er in het bestand staan, wat resulteert in [aantal oorspronkelijke query's] x [aantal query's in het bestand Keywords] = [totaal aantal query's] als resultaat van de macro.

Bijvoorbeeld, als het bestand keywords.txt het volgende bevat:

free
online

Dan zal de substitutie-macro de 3 basisquery's veranderen in 6:

free fantasy
online fantasy
free tower defense
online tower defense
free rpg
online rpg

Voorbeelden van resultaatweergave

A-Parser ondersteunt flexibele formattering van resultaten dankzij de ingebouwde sjabloon-engine Template Toolkit, waardoor resultaten in een vrije vorm kunnen worden weergegeven, evenals in gestructureerde formaten zoals CSV of JSON.

Standaardweergave

Resultaatformaat:

$serp.format('$name ($rating, $author): $desc ($link, $price)\n')

Voorbeeld van resultaat:

Heart Rate Monitor (4.5, Meet Your Need Production): Most Precise Heart Rate Monitor Ever + Unlimited Measurements and Records. (https://play.google.com/store/apps/details?id=com.supersimpleapps.heart_rate_monitor_newui, free)  
Instant Heart Rate : Heart Rate & Pulse Monitor (4.3, Azumio Inc.): Best way to track heart rate, health, fitness, workout, cardio, stress, training (https://play.google.com/store/apps/details?id=si.modula.android.instantheartrate, free)
Pulse - Heart Rate Monitor (4.3, Ahmerov Vadim): Get your heart rate in seconds! The Best way to measure your heart rate. (https://play.google.com/store/apps/details?id=com.icebit.pulse, free)
Heart Rate Monitor (4.5, REPS): The simplest yet the most accurate app to monitor your heart rate! (https://play.google.com/store/apps/details?id=com.repsi.heartrate, free)
Cardiograph - Heart Rate Meter (3.8, MacroPinch): How fast is your heart beating? Measure your pulse. (https://play.google.com/store/apps/details?id=com.macropinch.hydra.android, free)
iCare Health Monitor (BP & HR) (4.6, iCare Fit Studio): Measure blood pressure,heart rate,vision,hearing,SpO2,breath rate by the phone (https://play.google.com/store/apps/details?id=comm.cchong.BloodAssistant, free)

Weergave in een CSV-tabel

Resultaatformaat:

[% FOREACH i IN serp; 
tools.CSVline(i.name, i.rating, i.author, i.price);
END %]

Bestandsnaam:

$datefile.format().csv

Begintekst:

Naam,Beoordeling,Auteur,Prijs

tip

In het resultaatformaat wordt de sjabloon-engine Template Toolkit toegepast om de elementen van de array $serp in een FOREACH-lus weer te geven.

In de bestandsnaam van de resultaten hoeft u alleen de bestandsextensie te wijzigen naar csv.

Om de optie "Prepend text" beschikbaar te maken in de Taakeditor, moet u "More options" activeren. In "Prepend text" schrijven we de kolomnamen gescheiden door komma's en maken we de tweede regel leeg.

Opslaan in SQL-formaat

Resultaatformaat:

[% FOREACH serp;
"INSERT INTO serp VALUES('" _ name _ "', '" _ rating _ "', '" _ author _ "')\n";
END %]

Voorbeeld van resultaat:

INSERT INTO serp VALUES('Internet Speed Test-FiberTest for Android Smart TV', '3.9', 'RedMango Analytics PVT LTD')
INSERT INTO serp VALUES('Phone Check and Test', '4.6', 'inPocket Software')
INSERT INTO serp VALUES('Speedtest by Ookla', '4.3', 'Ookla')
INSERT INTO serp VALUES('Expert Speed Test WiFi Analyzer - analiti', '4.6', 'analiti Experts Group')
INSERT INTO serp VALUES('Brain Test: Tricky Puzzles', '4.6', 'Unico Studio')
INSERT INTO serp VALUES('Love Test Calculator - Compatibility Tester Prank', '3.8', 'DH3 Games')
INSERT INTO serp VALUES('FAST Speed Test', '4.3', 'Netflix, Inc.')
INSERT INTO serp VALUES('DMV WRITTEN TEST: Free DMV Tests for All 50 States', '4.7', 'DMV Written Test')
INSERT INTO serp VALUES('Brain Test 2: Tricky Stories', '4.6', 'Unico Studio')
INSERT INTO serp VALUES('Internet speed test Meter- SpeedTest Master', '4.9', 'Test speed internet & Net meter')
INSERT INTO serp VALUES('Test Your Android - Hardware Testing & Utilities', '4.2', 'Hibernate')
INSERT INTO serp VALUES('Stupid Test - How Smart Are You?', '3.6', 'DH3 Games')
INSERT INTO serp VALUES('love test', '4.1', 'MobilPlug')
INSERT INTO serp VALUES('Personality Trait Test', '4.2', 'Aaditya Prakash')
INSERT INTO serp VALUES('Aptitude test. Personality test games', '4.2', 'iq test')
INSERT INTO serp VALUES('What animal are you? Test', '3.5', 'Hemisoft')
INSERT INTO serp VALUES('Lie Detector Face Test Simulator Prank', '3.9', 'Droidheads')
INSERT INTO serp VALUES('BFF Friendship Test', '4.1', 'DH3 Games')
INSERT INTO serp VALUES('IQ and Aptitude Test Practice', '4.0', 'LangiS')
INSERT INTO serp VALUES('FCC Speed Test', '3.3', 'FCCAPPs')
INSERT INTO serp VALUES('40+ Psychological Tests', '4.4', 'MuraDev')
INSERT INTO serp VALUES('G1 Test Genie: Drivers Test Practice Ontario 2021', '4.5', 'Elegant E-Learning')
INSERT INTO serp VALUES('Brain test - psychological and iq test', '4.4', 'iq test')

Resultaatdump naar JSON

Algemeen resultaatformaat:

[% IF notFirst;
",\n";
ELSE;
notFirst = 1;
END;

obj = {};
obj.serp = [];

FOREACH item IN p1.serp;
obj.serp.push({
name = item.name
author = item.author
rating = item.rating
price = item.price
});
END;

obj.json %]

Begintekst:

[

Eindtekst:

]

Voorbeeld van resultaat:

[{"serp": [{"name":"Internet Speed Test-FiberTest for Android Smart TV","price":"free","author":"RedMango Analytics PVT LTD","rating":"3.9"},{"name":"Phone Check and Test","price":"free","author":"inPocket Software","rating":"4.6"},{"name":"Speedtest by Ookla","price":"free","author":"Ookla","rating":"4.3"},{"name":"Expert Speed Test WiFi Analyzer - analiti","price":"free","author":"analiti Experts Group","rating":"4.6"},{"name":"Brain Test: Tricky Puzzles","price":"free","author":"Unico Studio","rating":"4.6"},{"name":"Love Test Calculator - Compatibility Tester Prank","price":"free","author":"DH3 Games","rating":"3.8"},{"name":"FAST Speed Test","price":"free","author":"Netflix, Inc.","rating":"4.3"},{"name":"DMV WRITTEN TEST: Free DMV Tests for All 50 States","price":"free","author":"DMV Written Test","rating":"4.7"},{"name":"Internet speed test Meter- SpeedTest Master","price":"free","author":"Test speed internet & Net meter","rating":"4.9"},{"name":"Brain Test 2: Tricky Stories","price":"free","author":"Unico Studio","rating":"4.6"},{"name":"Stupid Test - How Smart Are You?","price":"free","author":"DH3 Games","rating":"3.6"}]}]
tip

Om de opties "Prepend text" en "Append text" beschikbaar te maken in de Taakeditor, moet u "More options" activeren.

Mogelijke instellingen

ParameterStandaardwaardeBeschrijving
CountryUnited StatesKeuze van het land van waaruit de zoekopdracht wordt uitgevoerd.
LanguageEnglishKeuze van de taal van de resultatenpagina.
PricesAllSelectie van resultaten op prijs (Gratis of Betaald).
RatingsAllSelectie van resultaten op beoordeling.