GooglePlay::Apps - Scraper di applicazioni Google Play
Panoramica dello scraper

GooglePlay::Apps – esegue lo scraping dei dati sulle app da Google Play. Raccolta automatizzata di tutti i dati: nome, valutazione, autore, descrizione, link all'app e prezzo.È possibile utilizzare la moltiplicazione automatica delle query, la sostituzione di sotto-query da file, l'iterazione di combinazioni alfanumeriche e liste per ottenere il massimo numero possibile di risultati. Utilizzando la filtrazione dei risultati è possibile pulire immediatamente l'output, rimuovendo tutta la spazzatura non necessaria (utilizzando le parole chiave negative).
La funzionalità di A-Parser consente di salvare le impostazioni di scraping dello scraper GooglePlay::Apps per un uso futuro (preset), impostare programmi di scraping e molto altro.
Il salvataggio dei risultati è possibile nel formato e nella struttura necessari, grazie al potente motore di modelli integrato Template Toolkit che consente di applicare logica aggiuntiva ai risultati e produrre dati in vari formati, tra cui JSON, SQL e CSV.
Casi d'uso dello scraper
🔗 Scraping di app in offerta
Ricerca di app in offerta su Google Play e salvataggio dei dati raccolti in un database
🔗 Suggerimenti di Google Play
Scraper di suggerimenti dello store Google Play
Dati raccolti
I dati vengono raccolti dal servizio play.google.com

- Nome
- Valutazione
- Descrizione
- Link all'applicazione
- Prezzo
- Numero di download
- Genere dell'applicazione
Funzionalità
- Scelta del paese da cui viene effettuata la ricerca
- Scelta della lingua della pagina dei risultati
- Ricerca per prezzo (Gratis o A pagamento)
- Ricerca per valutazione (Tutte o superiori a 4+)
Casi d'uso
- Scraping di dati sulle applicazioni da Google Play
Query
Come query è necessario indicare le frasi con cui verrà effettuata la ricerca in Google Play, ad esempio:
pulsometro
Sostituzioni nelle query
È possibile utilizzare le macro integrate per la sostituzione automatica di sotto-query da file; ad esempio, se vogliamo aggiungere a ogni query un elenco di altre parole, indichiamo alcune query principali:
fantasy
tower defense
rpg
Nel formato della query indichiamo la macro per la sostituzione di parole aggiuntive dal file keywords.txt, questo metodo consente di aumentare esponenzialmente la varietà delle query:
{subs:keywords} $query
Questa macro creerà tante query aggiuntive quante sono presenti nel file per ogni query di ricerca originale, il che risulterà in [numero di query originali] x [numero di query nel file Keywords] = [numero totale di query] come risultato del lavoro della macro.
Ad esempio, se il file keywords.txt contiene:
free
online
Alla fine, la macro di sostituzione trasformerà le 3 query principali in 6:
free fantasy
online fantasy
free tower defense
online tower defense
free rpg
online rpg
Esempi di output dei risultati
A-Parser supporta la formattazione flessibile dei risultati grazie al motore di modelli integrato Template Toolkit, che gli consente di produrre risultati in forma arbitraria, così come in forma strutturata, ad esempio CSV o JSON
Output predefinito
Formato del risultato:
$serp.format('$name ($rating, $author): $desc ($link, $price)\n')
Esempio di risultato:
Heart Rate Monitor (4.5, Meet Your Need Production): Most Precise Heart Rate Monitor Ever + Unlimited Measurements and Records. (https://play.google.com/store/apps/details?id=com.supersimpleapps.heart_rate_monitor_newui, free)
Instant Heart Rate : Heart Rate & Pulse Monitor (4.3, Azumio Inc.): Best way to track heart rate, health, fitness, workout, cardio, stress, training (https://play.google.com/store/apps/details?id=si.modula.android.instantheartrate, free)
Pulse - Heart Rate Monitor (4.3, Ahmerov Vadim): Get your heart rate in seconds! The Best way to measure your heart rate. (https://play.google.com/store/apps/details?id=com.icebit.pulse, free)
Heart Rate Monitor (4.5, REPS): The simplest yet the most accurate app to monitor your heart rate! (https://play.google.com/store/apps/details?id=com.repsi.heartrate, free)
Cardiograph - Heart Rate Meter (3.8, MacroPinch): How fast is your heart beating? Measure your pulse. (https://play.google.com/store/apps/details?id=com.macropinch.hydra.android, free)
iCare Health Monitor (BP & HR) (4.6, iCare Fit Studio): Measure blood pressure,heart rate,vision,hearing,SpO2,breath rate by the phone (https://play.google.com/store/apps/details?id=comm.cchong.BloodAssistant, free)
Output in tabella CSV
Formato del risultato:
[% FOREACH i IN serp;
tools.CSVline(i.name, i.rating, i.author, i.price);
END %]
Nome del file:
$datefile.format().csv
Testo iniziale:
Nome,Valutazione,Autore,Prezzo
Nel Formato dei risultati viene applicato il motore di modelli Template Toolkit per l'output degli elementi dell'array $serp in un ciclo FOREACH.
Nel nome del file dei risultati è sufficiente cambiare l'estensione del file in csv.
Affinché l'opzione "Prepend text" sia disponibile nell'Editor delle attività, è necessario attivare "More options". In "Prepend text" scriviamo i nomi delle colonne separati da virgola e lasciamo la seconda riga vuota.
Salvataggio in formato SQL
Formato del risultato:
[% FOREACH serp;
"INSERT INTO serp VALUES('" _ name _ "', '" _ rating _ "', '" _ author _ "')\n";
END %]
Esempio di risultato:
INSERT INTO serp VALUES('Internet Speed Test-FiberTest for Android Smart TV', '3.9', 'RedMango Analytics PVT LTD')
INSERT INTO serp VALUES('Phone Check and Test', '4.6', 'inPocket Software')
INSERT INTO serp VALUES('Speedtest by Ookla', '4.3', 'Ookla')
INSERT INTO serp VALUES('Expert Speed Test WiFi Analyzer - analiti', '4.6', 'analiti Experts Group')
INSERT INTO serp VALUES('Brain Test: Tricky Puzzles', '4.6', 'Unico Studio')
INSERT INTO serp VALUES('Love Test Calculator - Compatibility Tester Prank', '3.8', 'DH3 Games')
INSERT INTO serp VALUES('FAST Speed Test', '4.3', 'Netflix, Inc.')
INSERT INTO serp VALUES('DMV WRITTEN TEST: Free DMV Tests for All 50 States', '4.7', 'DMV Written Test')
INSERT INTO serp VALUES('Brain Test 2: Tricky Stories', '4.6', 'Unico Studio')
INSERT INTO serp VALUES('Internet speed test Meter- SpeedTest Master', '4.9', 'Test speed internet & Net meter')
INSERT INTO serp VALUES('Test Your Android - Hardware Testing & Utilities', '4.2', 'Hibernate')
INSERT INTO serp VALUES('Stupid Test - How Smart Are You?', '3.6', 'DH3 Games')
INSERT INTO serp VALUES('love test', '4.1', 'MobilPlug')
INSERT INTO serp VALUES('Personality Trait Test', '4.2', 'Aaditya Prakash')
INSERT INTO serp VALUES('Aptitude test. Personality test games', '4.2', 'iq test')
INSERT INTO serp VALUES('What animal are you? Test', '3.5', 'Hemisoft')
INSERT INTO serp VALUES('Lie Detector Face Test Simulator Prank', '3.9', 'Droidheads')
INSERT INTO serp VALUES('BFF Friendship Test', '4.1', 'DH3 Games')
INSERT INTO serp VALUES('IQ and Aptitude Test Practice', '4.0', 'LangiS')
INSERT INTO serp VALUES('FCC Speed Test', '3.3', 'FCCAPPs')
INSERT INTO serp VALUES('40+ Psychological Tests', '4.4', 'MuraDev')
INSERT INTO serp VALUES('G1 Test Genie: Drivers Test Practice Ontario 2021', '4.5', 'Elegant E-Learning')
INSERT INTO serp VALUES('Brain test - psychological and iq test', '4.4', 'iq test')
Dump dei risultati in JSON
Formato comune del risultato:
[% IF notFirst;
",\n";
ELSE;
notFirst = 1;
END;
obj = {};
obj.serp = [];
FOREACH item IN p1.serp;
obj.serp.push({
name = item.name
author = item.author
rating = item.rating
price = item.price
});
END;
obj.json %]
Testo iniziale:
[
Testo finale:
]
Esempio di risultato:
[{"serp": [{"name":"Internet Speed Test-FiberTest for Android Smart TV","price":"free","author":"RedMango Analytics PVT LTD","rating":"3.9"},{"name":"Phone Check and Test","price":"free","author":"inPocket Software","rating":"4.6"},{"name":"Speedtest by Ookla","price":"free","author":"Ookla","rating":"4.3"},{"name":"Expert Speed Test WiFi Analyzer - analiti","price":"free","author":"analiti Experts Group","rating":"4.6"},{"name":"Brain Test: Tricky Puzzles","price":"free","author":"Unico Studio","rating":"4.6"},{"name":"Love Test Calculator - Compatibility Tester Prank","price":"free","author":"DH3 Games","rating":"3.8"},{"name":"FAST Speed Test","price":"free","author":"Netflix, Inc.","rating":"4.3"},{"name":"DMV WRITTEN TEST: Free DMV Tests for All 50 States","price":"free","author":"DMV Written Test","rating":"4.7"},{"name":"Internet speed test Meter- SpeedTest Master","price":"free","author":"Test speed internet & Net meter","rating":"4.9"},{"name":"Brain Test 2: Tricky Stories","price":"free","author":"Unico Studio","rating":"4.6"},{"name":"Stupid Test - How Smart Are You?","price":"free","author":"DH3 Games","rating":"3.6"}]}]
Affinché le opzioni "Prepend text" e "Append text" siano disponibili nell'Editor delle attività, è necessario attivare "More options".
Impostazioni possibili
| Parametro | Valore predefinito | Descrizione |
|---|---|---|
| Country | United States | Scelta del paese da cui viene effettuata la ricerca. |
| Language | English | Scelta della lingua della pagina dei risultati. |
| Prices | All | Selezione dei risultati per prezzo (Gratis o A pagamento). |
| Ratings | All | Selezione dei risultati per valutazione. |