Вопросы и ответы из выдачи Google

Пресет Вопросы и ответы из выдачи Google 3.2.1

Доступно владельцам лицензии
Спасибо за быстрый ответ. Если я правильно понял, то в логах по этим заданиям ничего нет. Если проблема повториться, отпишу в @aparser_bot

222222.png



photo-2021-11-04-11-54-23.jpg
 
добавьте пж в результаты questions - url ссылки на ответ. Полезно для понимания какие страницы каких сайтов хорошо залетают, чтобы подсмотреть их страницы, для оптимизации своего сайта
 
как складывать результаты этого парсера в sqlite ?

пробую так:
[% CALL tools.sqlite.run('results/paa.sqlite3', 'INSERT INTO qa(keyword, questions) VALUES(?, ?)', query.first, p1.questions.format('$question\n$answer\n')) %]

но в результате создается 5 строк (какой уровень parse to level стоит),
 
но в результате создается 5 строк (какой уровень parse to level стоит),
Скорее всего потому что вы используете режим To level. Переключитесь на By count, чтобы се собралось в одном потоке и сразу записалось одной транзакцией.
 
Добрый день. А можно сделать аналогичный парсер под ПС Яндекс?
Готов на персональную платную разработку. Заполнял бриф по услуге на сайте, ответа не поступило. По данному вопросу отпишите в ЛС пжл.
 
подскажите, пожалуйста, а как сделать так, чтобы сам ответ на вопрос тоже парсился? как и куда вставить регулярку необходимо в парсер.

И как сделать так, чтобы если в самом блоке People Also Ask есть картинка или видео, то они тоже сохранялись, при этом избавиться от лишнего мусора, как при чистке HTML

Заранее большое спасибо!
 

Вложения

  • 8e134c1940.jpeg
    8e134c1940.jpeg
    91,7 КБ · Просмотры: 10
как сделать так, чтобы сам ответ на вопрос тоже парсился?
Это пример парсинга именно вопросов/ответов из выдачи Гугла (People also ask). Расширенный сниппет здесь не собирается, но можете добавить для себя такой функционал, код JS парсера открыт, вы легко можете дописать нужную логику.

И как сделать так, чтобы если в самом блоке People Also Ask есть картинка или видео, то они тоже сохранялись, при этом избавиться от лишнего мусора, как при чистке HTML
Это можно сделать также дописав в JS парсере соответствующую логику по извлечению нужных ссылок перед очисткой от HTML.
 
подскажите, пожалуйста, а как сделать отчет в такой формате:
запрос 1 - вопрос 1 - ответ 1
запрос 1 - вопрос 2 - ответ 2
запрос 1 - вопрос 3 - ответ 3
....
запрос 500 - вопрос 1 - ответ 1
и т.д.

То есть чтобы не удалялись повторяющиеся вопросы и выдавалось в таком формате.
Откорректировал Result format на такой:
$query\tQ: $question\tA: $answer\n

Но почему-то в итоговом файле всё равно формат не такой, откуда-то в первом столбце появляются вопросы..
 

Вложения

  • NrHh5W2[1].png
    NrHh5W2[1].png
    117 КБ · Просмотры: 17
не удалялись повторяющиеся вопросы
Удалите из задания уникализацию.

Но почему-то в итоговом файле всё равно формат не такой, откуда-то в первом столбце появляются вопросы..
Не понятен вопрос, на скриншоте у вас ровно то, о чем вы спрашиваете...
 
Не понятен вопрос, на скриншоте у вас ровно то, о чем вы спрашиваете...

нет, не совсем. смотрите, ввожу для текста всего 1 запрос: write my essay

меняю Result format на такой: $query\tQ: $question\tA: $answer\n и первые четыре строки выдает в норм формате, в последующих строках этот запрос (write my essay) исчезает и видно, что на его место становятся вопросы, начиная с "Can I get someone to write my essay for free?"

в целом довольно в выдаче значительно меньше вопросов чем выдает A-Parser :) возможно оно и к лучшему, но хотелось бы иметь 2 варианта для последующей обработки этим вопросов
 

Вложения

  • yFDhqQ6[1].png
    yFDhqQ6[1].png
    1.009,7 КБ · Просмотры: 11
Назад
Верх