Всем привет!
Думаю у многих возникал вопрос как напарсить статьи с сайтов.
Лучше что придумал на данный момент это парсить список урлов (думаю тут ни у кого не возникает проблем) а потом парсером HTML::TextExtractor вытягивать контент.
Но, есть ньюансы - как заставить вытягивать только статью без другого контента который идет на странице, и как сохранять каждую статью с целевого сайта в отдельный файл?
Сайты со статьями для примера:
http://www.personal-loan.my/al-rajhi-personal-loan/236/
http://www.auctioncope.com/guide/how-to-remove-paypal-limitation-and-restore-account-access/
http://www.acaloans.com.au/personal-finance/
Думаю у многих возникал вопрос как напарсить статьи с сайтов.
Лучше что придумал на данный момент это парсить список урлов (думаю тут ни у кого не возникает проблем) а потом парсером HTML::TextExtractor вытягивать контент.
Но, есть ньюансы - как заставить вытягивать только статью без другого контента который идет на странице, и как сохранять каждую статью с целевого сайта в отдельный файл?
Сайты со статьями для примера:
http://www.personal-loan.my/al-rajhi-personal-loan/236/
http://www.auctioncope.com/guide/how-to-remove-paypal-limitation-and-restore-account-access/
http://www.acaloans.com.au/personal-finance/