Ir al contenido principal

Maps::Yandex - Extractor de Yandex Maps

img

Descripción del extractor

El extractor de Yandex Maps recopila datos de contacto de organizaciones.

La funcionalidad de A-Parser permite guardar la configuración de extracción de datos para su uso posterior (ajustes preestablecidos), establecer programas de extracción de datos y mucho más. Puede utilizar la multiplicación automática de consultas, la sustitución de subconsultas desde archivos, el escaneo de combinaciones alfanuméricas y listas para obtener el máximo número posible de resultados.

Es posible guardar los resultados en la forma y estructura que necesite, gracias al potente motor de plantillas integrado Template Toolkit que permite aplicar lógica adicional a los resultados y exportar datos en varios formatos, incluidos JSON, SQL y CSV.

Datos recopilados

  • Nombre de la organización
  • Dirección y coordenadas
  • Calificación, número de reseñas y política de precios
  • Categorías y etiquetas
  • Sitio web, redes sociales y teléfonos
  • Enlace a la foto y al logotipo
  • Descripción
  • Enlace a la página de la organización en Yandex Maps
  • Información sobre el horario de apertura del establecimiento

Características

  • Es obligatorio indicar las coordenadas y el zoom del área en la que se realiza la búsqueda
  • Posibilidad de establecer el número de páginas para la recopilación de datos
  • Posibilidad de especificar el idioma de los resultados
  • Posibilidad de utilizar AntiGate para eludir captchas

Casos de uso

  • Recopilación de una lista de organizaciones presentes en un área determinada
  • Obtención de contactos de organizaciones
  • Cualquier otro caso que implique la búsqueda de organizaciones en mapas

Consultas

Como consultas, es necesario indicar palabras clave, exactamente igual que si se introdujeran directamente en el formulario de búsqueda de Yandex Maps, por ejemplo:

pizza

Opciones de salida de resultados

A-Parser admite un formateo flexible de los resultados gracias al motor de plantillas integrado Template Toolkit, lo que le permite mostrar los resultados en forma libre, así como estructurada, por ejemplo CSV o JSON.

Salida por defecto

Formato del resultado:

$serp.format('$name ($rating): $address\n')

Como resultado, se muestra una lista de organizaciones, sus calificaciones y direcciones:

Pirogi № 1 (4.9): Rossiya, Moskva, ulitsa Bolshiye Kamenshchiki, 9, str. B
Einstein lounge (4.8): Rossiya, Moskva, Taganskaya ulitsa, 29, str. 1
Gusto (4.1): Rossiya, Moskva, ulitsa Bolshaya Dmitrovka, 7/5s1
Friends (4.4): Rossiya, Moskva, Krasnobogatyrskaya ulitsa, 90, str. 2
Shisha City (4.4): Rossiya, Moskva, Vorontsovskaya ulitsa, 6, str. 7
Jacks (4.4): Rossiya, Moskva, 1-ya Frezernaya ulitsa, 2/1s10
Restaurante Guilty Pleasure (4.3): Rossiya, Moskva, Oruzheynyy pereulok, 15A
White Fox (4.3): Rossiya, Moskva, Bolshoy Drovyanoy pereulok, 6

Salida de todos los datos de contacto

Formato del resultado:

$serp.format('$name ($rating): $address, $reviews, $price, $categories, $tags, $site, $phones, $photo, $coordinates, $social, $logo, $description, $link\n')

Ejemplo de resultado:

Pirogi № 1 (4.9): Rossiya, Moskva, ulitsa Bolshiye Kamenshchiki, 9, str. B, 256, , Entrega de comida, Pizzerías, Panaderías, entrega gratuita, pago con tarjeta, entrega de productos, entrega de comida, https://piroginomerodin.ru/, +7 (499) 642-32-71, +7 (495) 127-78-47, https://avatars.mds.yandex.net/get-altay/4489303/2a000001787d1771aebf8b4b849d986caea1/XXXL, 37.65577,55.738421, https://vk.com/piroginomerodin, https://www.instagram.com/piroginomerodin/, https://avatars.mds.yandex.net/get-tycoon/474201/2a0000016dd037b101f0cd4ad3968416440e/priority-headline-logo, , https://yandex.ru/maps/org/105121172016/
Einstein lounge (4.8): Rossiya, Moskva, Taganskaya ulitsa, 29, str. 1, 153, 900–1500 ₽, Bares de cachimba, Bares, pubs, Juegos intelectuales, juegos de mesa, terraza de verano, pago con tarjeta, almuerzo de negocios, proyector, Wi-Fi, transmisiones deportivas, , +7 (968) 068-99-09, https://avatars.mds.yandex.net/get-altay/2419289/2a000001748889d4246610a4f452790b8eee/XXXL, 37.668036,55.739651, https://www.instagram.com/einstein_lounge/, https://avatars.mds.yandex.net/get-tycoon/1635364/2a00000170a408e3bda96d25bf44857eed75/priority-headline-logo, , https://yandex.ru/maps/org/127811263445/
Gusto (4.1): Rossiya, Moskva, ulitsa Bolshaya Dmitrovka, 7/5s1, 133, 1500–1700 ₽, Restaurantes, Pizzerías, almuerzo de negocios, Wi-Fi, café para llevar, comida para llevar, terraza de verano, pago con tarjeta, transmisiones deportivas, http://www.gusto-moscow.ru/, +7 (495) 650-69-22, https://avatars.mds.yandex.net/get-altay/2887807/2a0000017357f4fe86d86cd5d3e300855b86/XXXL, 37.614142,55.760285, https://www.facebook.com/pages/gusto-итальянская-кухня/300193353486996, https://www.instagram.com/gusto.rest/, , , https://yandex.ru/maps/org/1080982853/
Shisha City (4.4): Rossiya, Moskva, Vorontsovskaya ulitsa, 6, str. 7, 68, 900–1200 ₽, Bares de cachimba, Bares, pubs, Anticafé, juegos de mesa, estacionamiento para discapacitados, pago con tarjeta, cerveza artesanal, Reserva en línea, Wi-Fi, transmisiones deportivas, http://www.shishataganka.ru/, +7 (958) 100-62-71, https://avatars.mds.yandex.net/get-altay/212783/2a0000015d991abf6d89fa812daac5491c4f/XXXL, 37.654414,55.739423, https://vk.com/shishacitytaganka, https://www.facebook.com/shishacitytaganka, https://www.instagram.com/shishacitytaganka, https://avatars.mds.yandex.net/get-tycoon/479792/2a000001746e2044d0177e25adeba8e943ac/priority-headline-logo, , https://yandex.ru/maps/org/1695943598/

Salida en tabla CSV

Formato del resultado:

[% FOREACH serp; 
tools.CSVline(name, rating, address, reviews, price);
END %]

Ejemplo de resultado:

"Pirogi № 1",4.9,"Rusia, Moscú, calle Bolshie Kamenshchiki, 9, str. B",256,
"Einstein lounge",4.8,"Rusia, Moscú, calle Taganskaya, 29, str. 1",153,"900–1500 ₽"
Gusto,4.1,"Rusia, Moscú, calle Bolshaya Dmitrovka, 7/5s1",134,"1500–1700 ₽"
"Shisha City",4.4,"Rusia, Moscú, calle Vorontsovskaya, 6, str. 7",68,"900–1200 ₽"
"Kalyannaya Kult Game",4.5,"Rusia, Moscú, calle Shabolovka, 2",66,"1200–1500 ₽"

Volcado de resultados en JSON

Formato general del resultado:

[% IF notFirst;
",\n";
ELSE;
notFirst = 1;
END;

obj = {};
obj.query = query;
obj.serp = [];

FOREACH item IN p1.serp;
obj.serp.push({
name = item.name
rating = item.rating
address = item.address
phones = item.phones
});
END;

obj.json %]

Texto inicial:

[

Texto final:

]

Ejemplo de resultado:

[{
"query": "pizza",
"serp": [
{
"name": "Pirogi № 1",
"address": "Rusia, Moscú, calle Bolshie Kamenshchiki, 9, str. B",
"phones": "+7 (499) 642-32-71, +7 (495) 127-78-47",
"rating": "4.9"
},
{
"name": "Einstein lounge",
"address": "Rusia, Moscú, calle Taganskaya, 29, str. 1",
"phones": "+7 (968) 068-99-09",
"rating": "4.8"
},
{
"name": "Gusto",
"address": "Rusia, Moscú, calle Bolshaya Dmitrovka, 7/5s1",
"phones": "+7 (495) 650-69-22",
"rating": "4.1"
},
]
}]
sugerencia

Para que las opciones "Texto inicial" y "Texto final" estén disponibles en el Editor de tareas, debe activar "Más opciones".

Configuraciones posibles

ParámetroValor por defectoDescripción
Coordinates55.780844,37.6572693Coordenadas del área de búsqueda, parámetro obligatorio
Zoom11Zoom, parámetro obligatorio
Pages count5Número de páginas
LanguageEnglishSelección del idioma de los resultados
AntiGate presetdefaultAjuste preestablecido del extractor configurado previamente Util::AntiGateUtil::AntiGate