SE::Quora - extractor de resultados de Quora

Revisión del extractor
SE::Quora - extractor de resultados de búsqueda de Quora.Recopila resultados del servicio del mismo nombre.
Puede utilizar la multiplicación automática de consultas, la sustitución de subconsultas desde archivos, el escaneo de combinaciones alfanuméricas y listas para obtener la mayor cantidad posible de resultados.
La funcionalidad de A-Parser permite guardar la configuración de extracción del extractor SE::Quora para su uso posterior (ajustes preestablecidos), establecer programas de extracción y mucho más.
Es posible guardar los resultados en la forma y estructura que necesite, gracias al potente motor de plantillas integrado Template Toolkit que permite aplicar lógica adicional a los resultados y exportar datos en varios formatos, incluyendo JSON, SQL y CSV.
Datos recopilados
En Quora existen 6 tipos de resultados: Questions, Answers, Posts, Profiles, Topics y Spaces. Cada tipo tiene un conjunto de datos diferente, por lo que en el extractor cada tipo se registra en su propia matriz separada. Dependiendo del tipo, se recopilan:
- Enlace a la pregunta, texto de la pregunta, número de respuestas y fecha
- Autor de la respuesta, texto de la respuesta, enlaces a medios en la respuesta, fecha y hora de la respuesta, número de votos, visualizaciones y cuántas veces se compartió la respuesta
- Enlace al post, título del post, texto del post, enlaces a medios en el post, nombre y enlace al perfil del autor, fecha y hora de publicación, número de votos, visualizaciones y cuántas veces se compartió
- y otros datos que dependen del tipo de resultado
Características
- Selección del tipo de resultado deseado o extracción de todos a la vez
- Selección del tiempo de los resultados
Variantes de uso
- Cualquier escenario donde sea necesario obtener datos de Quora
Consultas
Como consultas es necesario indicar palabras clave, por ejemplo:
test
Variantes de salida de resultados
A-Parser admite un formato flexible de resultados gracias al motor de plantillas integrado Template Toolkit, lo que le permite presentar los resultados en forma arbitraria, así como estructurada, por ejemplo CSV o JSON
Salida por defecto
Formato de resultado:
$questions.format('$question\n')
Ejemplo de resultado:
What is the best free online IQ test?
What is software testing?
How reliable is the DNA testing offered by sites like Ancestry.com or 23andMe?
How can I pass a urine drug test for meth?
How do you know if you're really smart without taking an IQ test?
Which is the best test series for CAT?
How reliable are online IQ tests?
Is software testing a good career choice?
What is the best test series for the GATE examination?
What is the best way to get my IQ checked online?
...
Obtención de cookies
Obtención de la opción obligatoria para la autorización
Spoiler: ¿cómo encontrar las cookies?
- Ir a quora.com, iniciar sesión
- Abrir las Herramientas de desarrollador (F12) y actualizar la página
- Ir a la pestaña Network, buscar la solicitud a quora.com
- Copiar toda la cadena de cookies

Según nuestras pruebas, las cuentas no se banean (esto puede cambiar en el futuro), pero al realizar la extracción en más de 10 hilos, Quora comienza a dar errores y mensajes sobre demasiadas solicitudes. Por lo tanto, se recomienda realizar la extracción en un número pequeño de hilos o utilizar cookies de varias cuentas.
Configuraciones posibles
| Parámetro | Valor por defecto | Descripción |
|---|---|---|
| Pages count | 5 | Cantidad de páginas de resultados |
| Results type | Questions | Tipo de resultados |
| Results time | All time | Tiempo de los resultados |
| Cookie | Campo para especificar cookies de cuentas autorizadas. Se pueden indicar cookies de varias cuentas, el extractor elegirá aleatoriamente entre ellas para cada intento. |