Zum Hauptinhalt springen

GooglePlay::Apps - Google Play App-Parser

Übersicht des Parsers

Übersicht des ParsersGooglePlay::AppsGooglePlay::Apps – extrahiert Daten über Apps aus Google Play. Automatisierte Erfassung aller Daten: Name, Bewertung, Autor, Beschreibung, Link zur App und Preis.

Sie können die automatische Abfragevervielfältigung, das Einsetzen von Unterabfragen aus Dateien, das Durchlaufen von alphanumerischen Kombinationen und Listen verwenden, um die maximal mögliche Anzahl an Ergebnissen zu erhalten. Mithilfe der Ergebnisfilterung können Sie das Ergebnis sofort bereinigen, indem Sie allen unnötigen Müll (unter Verwendung von Minus-Wörtern) entfernen.

Die Funktionalität von A-Parser ermöglicht es, die Datenerfassungseinstellungen des Scrapers GooglePlay::Apps für die spätere Verwendung zu speichern (Presets), Zeitpläne für die Datenerfassung festzulegen und vieles mehr.

Das Speichern der Ergebnisse ist in der von Ihnen benötigten Form und Struktur möglich, dank des integrierten leistungsstarken Template-Engines Template Toolkit, der es erlaubt, zusätzliche Logik auf die Ergebnisse anzuwenden und Daten in verschiedenen Formaten auszugeben, einschließlich JSON, SQL und CSV.

Anwendungsfälle für den Scraper

Gesammelte Daten

Die Daten werden vom Dienst play.google.com gesammelt.

Gesammelte Daten
  • Name
  • Bewertung
  • Beschreibung
  • Link zur App
  • Preis
  • Anzahl der Downloads
  • Genre der App

Funktionen

  • Auswahl des Landes, von dem aus die Suche durchgeführt wird
  • Auswahl der Sprache der Ergebnisseite
  • Suche nach Preis (Free oder Paid)
  • Suche nach Bewertung (Alle oder über 4+)

Einsatzmöglichkeiten

  • Datenerfassung von App-Informationen aus Google Play

Abfragen

Als Abfragen müssen Phrasen angegeben werden, nach denen in Google Play gesucht werden soll, zum Beispiel:

Pulsmesser

Abfrage-Platzhalter

Sie können integrierte Makros für das automatische Einsetzen von Unterabfragen aus Dateien verwenden. Wenn wir beispielsweise zu jeder Abfrage eine Liste anderer Wörter hinzufügen möchten, geben wir einige Hauptabfragen an:

fantasy
tower defense
rpg

Im Abfrageformat geben wir das Makro zum Einsetzen zusätzlicher Wörter aus der Datei keywords.txt an. Diese Methode ermöglicht es, die Variabilität der Abfragen um ein Vielfaches zu erhöhen:

{subs:keywords} $query 

Dieses Makro erstellt für jede ursprüngliche Suchabfrage so viele zusätzliche Abfragen, wie in der Datei enthalten sind, was in der Summe [Anzahl der ursprünglichen Abfragen] x [Anzahl der Abfragen in der Datei Keywords] = [Gesamtanzahl der Abfragen] als Ergebnis der Makroarbeit ergibt.

Wenn die Datei keywords.txt beispielsweise Folgendes enthält:

free
online

Am Ende verwandelt das Platzhalter-Makro 3 Hauptabfragen in 6:

free fantasy
online fantasy
free tower defense
online tower defense
free rpg
online rpg

Ausgabebeispiele für Ergebnisse

A-Parser unterstützt eine flexible Formatierung der Ergebnisse dank des integrierten Template-Engines Template Toolkit, was es ermöglicht, Ergebnisse in beliebiger Form sowie strukturiert auszugeben, zum Beispiel als CSV oder JSON.

Standardausgabe

Ergebnisformat:

$serp.format('$name ($rating, $author): $desc ($link, $price)\n')

Beispielergebnis:

Heart Rate Monitor (4.5, Meet Your Need Production): Most Precise Heart Rate Monitor Ever + Unlimited Measurements and Records. (https://play.google.com/store/apps/details?id=com.supersimpleapps.heart_rate_monitor_newui, free)  
Instant Heart Rate : Heart Rate & Pulse Monitor (4.3, Azumio Inc.): Best way to track heart rate, health, fitness, workout, cardio, stress, training (https://play.google.com/store/apps/details?id=si.modula.android.instantheartrate, free)
Pulse - Heart Rate Monitor (4.3, Ahmerov Vadim): Get your heart rate in seconds! The Best way to measure your heart rate. (https://play.google.com/store/apps/details?id=com.icebit.pulse, free)
Heart Rate Monitor (4.5, REPS): The simplest yet the most accurate app to monitor your heart rate! (https://play.google.com/store/apps/details?id=com.repsi.heartrate, free)
Cardiograph - Heart Rate Meter (3.8, MacroPinch): How fast is your heart beating? Measure your pulse. (https://play.google.com/store/apps/details?id=com.macropinch.hydra.android, free)
iCare Health Monitor (BP & HR) (4.6, iCare Fit Studio): Measure blood pressure,heart rate,vision,hearing,SpO2,breath rate by the phone (https://play.google.com/store/apps/details?id=comm.cchong.BloodAssistant, free)

Ausgabe in eine CSV-Tabelle

Ergebnisformat:

[% FOREACH i IN serp; 
tools.CSVline(i.name, i.rating, i.author, i.price);
END %]

Dateiname:

$datefile.format().csv

Anfangstext:

Name,Bewertung,Autor,Preis

Tipp

Im Ergebnisformat wird der Template Toolkit Template-Engine verwendet, um die Elemente des Arrays $serp in einer FOREACH-Schleife auszugeben.

Im Namen der Ergebnisdatei muss lediglich die Dateiendung in csv geändert werden.

Damit die Option "Anfangstext" im Task-Editor verfügbar ist, muss "Mehr Optionen" aktiviert werden. In "Anfangstext" schreiben wir die Spaltennamen durch Komma getrennt und lassen die zweite Zeile leer.

Speichern im SQL-Format

Ergebnisformat:

[% FOREACH serp;
"INSERT INTO serp VALUES('" _ name _ "', '" _ rating _ "', '" _ author _ "')\n";
END %]

Beispielergebnis:

INSERT INTO serp VALUES('Internet Speed Test-FiberTest for Android Smart TV', '3.9', 'RedMango Analytics PVT LTD')
INSERT INTO serp VALUES('Phone Check and Test', '4.6', 'inPocket Software')
INSERT INTO serp VALUES('Speedtest by Ookla', '4.3', 'Ookla')
INSERT INTO serp VALUES('Expert Speed Test WiFi Analyzer - analiti', '4.6', 'analiti Experts Group')
INSERT INTO serp VALUES('Brain Test: Tricky Puzzles', '4.6', 'Unico Studio')
INSERT INTO serp VALUES('Love Test Calculator - Compatibility Tester Prank', '3.8', 'DH3 Games')
INSERT INTO serp VALUES('FAST Speed Test', '4.3', 'Netflix, Inc.')
INSERT INTO serp VALUES('DMV WRITTEN TEST: Free DMV Tests for All 50 States', '4.7', 'DMV Written Test')
INSERT INTO serp VALUES('Brain Test 2: Tricky Stories', '4.6', 'Unico Studio')
INSERT INTO serp VALUES('Internet speed test Meter- SpeedTest Master', '4.9', 'Test speed internet & Net meter')
INSERT INTO serp VALUES('Test Your Android - Hardware Testing & Utilities', '4.2', 'Hibernate')
INSERT INTO serp VALUES('Stupid Test - How Smart Are You?', '3.6', 'DH3 Games')
INSERT INTO serp VALUES('love test', '4.1', 'MobilPlug')
INSERT INTO serp VALUES('Personality Trait Test', '4.2', 'Aaditya Prakash')
INSERT INTO serp VALUES('Aptitude test. Personality test games', '4.2', 'iq test')
INSERT INTO serp VALUES('What animal are you? Test', '3.5', 'Hemisoft')
INSERT INTO serp VALUES('Lie Detector Face Test Simulator Prank', '3.9', 'Droidheads')
INSERT INTO serp VALUES('BFF Friendship Test', '4.1', 'DH3 Games')
INSERT INTO serp VALUES('IQ and Aptitude Test Practice', '4.0', 'LangiS')
INSERT INTO serp VALUES('FCC Speed Test', '3.3', 'FCCAPPs')
INSERT INTO serp VALUES('40+ Psychological Tests', '4.4', 'MuraDev')
INSERT INTO serp VALUES('G1 Test Genie: Drivers Test Practice Ontario 2021', '4.5', 'Elegant E-Learning')
INSERT INTO serp VALUES('Brain test - psychological and iq test', '4.4', 'iq test')

Ergebnis-Dump in JSON

Allgemeines Ausgabeformat:

[% IF notFirst;
",\n";
ELSE;
notFirst = 1;
END;

obj = {};
obj.serp = [];

FOREACH item IN p1.serp;
obj.serp.push({
name = item.name
author = item.author
rating = item.rating
price = item.price
});
END;

obj.json %]

Anfangstext:

[

Endtext:

]

Beispielergebnis:

[{"serp": [{"name":"Internet Speed Test-FiberTest for Android Smart TV","price":"free","author":"RedMango Analytics PVT LTD","rating":"3.9"},{"name":"Phone Check and Test","price":"free","author":"inPocket Software","rating":"4.6"},{"name":"Speedtest by Ookla","price":"free","author":"Ookla","rating":"4.3"},{"name":"Expert Speed Test WiFi Analyzer - analiti","price":"free","author":"analiti Experts Group","rating":"4.6"},{"name":"Brain Test: Tricky Puzzles","price":"free","author":"Unico Studio","rating":"4.6"},{"name":"Love Test Calculator - Compatibility Tester Prank","price":"free","author":"DH3 Games","rating":"3.8"},{"name":"FAST Speed Test","price":"free","author":"Netflix, Inc.","rating":"4.3"},{"name":"DMV WRITTEN TEST: Free DMV Tests for All 50 States","price":"free","author":"DMV Written Test","rating":"4.7"},{"name":"Internet speed test Meter- SpeedTest Master","price":"free","author":"Test speed internet & Net meter","rating":"4.9"},{"name":"Brain Test 2: Tricky Stories","price":"free","author":"Unico Studio","rating":"4.6"},{"name":"Stupid Test - How Smart Are You?","price":"free","author":"DH3 Games","rating":"3.6"}]}]
Tipp

Damit die Optionen "Anfangstext" und "Endtext" im Task-Editor verfügbar sind, muss "Mehr Optionen" aktiviert werden.

Mögliche Einstellungen

ParameterStandardwertBeschreibung
CountryUnited StatesAuswahl des Landes, von dem aus die Suche durchgeführt wird.
LanguageEnglishAuswahl der Sprache der Ergebnisseite.
PricesAllAuswahl der Ergebnisse nach Preis (Free oder Paid).
RatingsAllAuswahl der Ergebnisse nach Bewertung.