Добрый день, Предложение не собирать почтовые адреса, которые внутри тегов placeholder у input-ов форм. Также, не собирать почты, которые внутри тегов <script></script> (с любым набором атрибутов, т.е. <script type="application/ld+json"> или "text/javascript"... и т.п.), или внутри html-комментариев вида <!-- comment --> В первом случае это почти всегда что-нибудь вроде [email protected], во втором - контакты авторов скрипта или вебмастера сайта. P.S. Забыл ещё один момент - не собирать почту, которая внутри <style></style> с любым набором атрибутов. Тоже совершенно не имеющие отношения ни к чему контакты разработчиков (см. скриншот) прилетают из этих данных.