Fallout
New Member
Нужна помощь в парсинге Lumendatabase.
Есть пресет:
http://sc.mmsot.com/2021-11-09-rl5f0.png
Регулярка:
<li class="notice result".+?class="sender"[^>]*>\s*(.+?)\s*<\/.+?class="receiver"[^>]*>\s*(.+?)\s*<\/.+?<ol class="excerpt">(.+?)<\/ol>
Result format:
[% FOREACH item IN items;
item.sender _ ' - ';
item.receiver _ ' - ';
item.linksdata.match('<li[^>]*>\s*(.+?)\s*<\/li>', 1).join(', ').remove('<[^>]+>') _ "\n";
END %]
Выдает следующую инфу:
http://sc.mmsot.com/2021-11-09-6v59t.png
Что нужно добавить в регулярку, чтобы парсер собирал и выводил еще и эту инфу?
http://sc.mmsot.com/2021-11-09-2hms5.png
Причем, чтоб парсер шел по страницам сайта Lumendatabase
Есть пресет:
http://sc.mmsot.com/2021-11-09-rl5f0.png
Регулярка:
<li class="notice result".+?class="sender"[^>]*>\s*(.+?)\s*<\/.+?class="receiver"[^>]*>\s*(.+?)\s*<\/.+?<ol class="excerpt">(.+?)<\/ol>
Result format:
[% FOREACH item IN items;
item.sender _ ' - ';
item.receiver _ ' - ';
item.linksdata.match('<li[^>]*>\s*(.+?)\s*<\/li>', 1).join(', ').remove('<[^>]+>') _ "\n";
END %]
Выдает следующую инфу:
http://sc.mmsot.com/2021-11-09-6v59t.png
Что нужно добавить в регулярку, чтобы парсер собирал и выводил еще и эту инфу?
http://sc.mmsot.com/2021-11-09-2hms5.png
Причем, чтоб парсер шел по страницам сайта Lumendatabase