В данной статье показан пример генерации файла дампа SQL, готового для импорта в базу данных. Для экранирования символов используется JS. Скрипт уже включен в пресет, поэтому нужна версия А-Парсера не ниже 1.1.457. Спойлер: Код для импорта Код: eyJwcmVzZXQiOiJTUUwgcmVzdWx0IiwidmFsdWUiOnsicHJlc2V0IjoiU1FMIHJl c3VsdCIsInBhcnNlcnMiOltbIlNFOjpHb29nbGUiLCJUT1AgMTAgKyBBRyJdXSwi cmVzdWx0c0Zvcm1hdCI6IlslIEZPUkVBQ0ggcDEuc2VycDtcblx0XCJJTlNFUlQg SU5UTyBzZXJwIFZBTFVFUygnXCIgXyB0b29scy5qcy5TUUxfZXNjYXBlKHF1ZXJ5 KSBfIFwiJywgJ1wiO1xuXHR0b29scy5qcy5TUUxfZXNjYXBlKGxpbmspIF8gXCIn LCAnXCI7XG5cdHRvb2xzLmpzLlNRTF9lc2NhcGUoYW5jaG9yKSBfIFwiJylcXG5c IjtcbkVORCAlXSIsInJlc3VsdHNTYXZlVG8iOiJmaWxlIiwicmVzdWx0c0ZpbGVO YW1lIjoiJGRhdGVmaWxlLmZvcm1hdCgpLnR4dCIsImFkZGl0aW9uYWxGb3JtYXRz IjpbXSwicmVzdWx0c1VuaXF1ZSI6Im5vIiwicXVlcnlGb3JtYXQiOlsiJHF1ZXJ5 Il0sInVuaXF1ZVF1ZXJpZXMiOmZhbHNlLCJzYXZlRmFpbGVkUXVlcmllcyI6ZmFs c2UsIml0ZXJhdG9yT3B0aW9ucyI6eyJvbkFsbExldmVscyI6ZmFsc2UsInF1ZXJ5 QnVpbGRlcnNBZnRlckl0ZXJhdG9yIjpmYWxzZSwicXVlcnlCdWlsZGVyc09uQWxs TGV2ZWxzIjpmYWxzZX0sInJlc3VsdHNPcHRpb25zIjp7Im92ZXJ3cml0ZSI6ZmFs c2V9LCJkb0xvZyI6Im5vIiwia2VlcFVuaXF1ZSI6Ik5vIiwibW9yZU9wdGlvbnMi OnRydWUsInJlc3VsdHNQcmVwZW5kIjoiIiwicmVzdWx0c0FwcGVuZCI6IiIsInF1 ZXJ5QnVpbGRlcnMiOltdLCJyZXN1bHRzQnVpbGRlcnMiOlt7InNvdXJjZSI6WzAs WyJzZXJwIiwiYW5jaG9yIl1dLCJ0eXBlIjoiZGVjb2RlSHRtbCIsImFycmF5Ijoi c2VycCIsInRvIjoiYW5jaG9yIn0seyJzb3VyY2UiOlswLFsic2VycCIsImFuY2hv ciJdXSwidHlwZSI6InJlbW92ZUh0bWwiLCJhcnJheSI6InNlcnAiLCJ0byI6ImFu Y2hvciJ9XSwiY29uZmlnT3ZlcnJpZGVzIjpbXSwicnVuVGFza09uQ29tcGxldGUi OiIiLCJ1c2VSZXN1bHRzRmlsZUFzUXVlcmllc0ZpbGUiOmZhbHNlLCJ0b29sc0pT IjoiVG9vbHMucHJvdG90eXBlLlNRTF9lc2NhcGUgPSBmdW5jdGlvbihzdHIpIHtc biAgICByZXR1cm4gc3RyLnJlcGxhY2UoL1tcXDBcXHgwOFxceDA5XFx4MWFcXG5c XHJcIidcXFxcXFwlXS9nLCBmdW5jdGlvbiAoY2hhcikge1xuICAgICAgICBzd2l0 Y2ggKGNoYXIpIHtcbiAgICAgICAgICAgIGNhc2UgXCJcXDBcIjpcbiAgICAgICAg ICAgICAgICByZXR1cm4gXCJcXFxcMFwiO1xuICAgICAgICAgICAgY2FzZSBcIlxc eDA4XCI6XG4gICAgICAgICAgICAgICAgcmV0dXJuIFwiXFxcXGJcIjtcbiAgICAg ICAgICAgIGNhc2UgXCJcXHgwOVwiOlxuICAgICAgICAgICAgICAgIHJldHVybiBc IlxcXFx0XCI7XG4gICAgICAgICAgICBjYXNlIFwiXFx4MWFcIjpcbiAgICAgICAg ICAgICAgICByZXR1cm4gXCJcXFxcelwiO1xuICAgICAgICAgICAgY2FzZSBcIlxc blwiOlxuICAgICAgICAgICAgICAgIHJldHVybiBcIlxcXFxuXCI7XG4gICAgICAg ICAgICBjYXNlIFwiXFxyXCI6XG4gICAgICAgICAgICAgICAgcmV0dXJuIFwiXFxc XHJcIjtcbiAgICAgICAgICAgIGNhc2UgXCJcXFwiXCI6XG4gICAgICAgICAgICBj YXNlIFwiJ1wiOlxuICAgICAgICAgICAgY2FzZSBcIlxcXFxcIjpcbiAgICAgICAg ICAgIGNhc2UgXCIlXCI6XG4gICAgICAgICAgICAgICAgcmV0dXJuIFwiXFxcXFwi K2NoYXI7XG4gICAgICAgIH1cbiAgICB9KTtcbn0ifSwicGFyc2Vyc0NvbmZQcmVz ZXRzIjp7IlNFOjpHb29nbGUiOnsiVE9QIDEwICsgQUciOnsicXVlcnlmb3JtYXQi OiIkcXVlcnkiLCJwYXJzZW5vdGZvdW5kIjp0cnVlLCJnbCI6IiIsInBhZ2Vjb3Vu dCI6MSwiZG9fZ3ppcCI6dHJ1ZSwiZG9tYWluIjoid3d3Lmdvb2dsZS5jb20iLCJ0 aW1lb3V0IjoiNjAiLCJ1c2Vwcm94eSI6dHJ1ZSwiYW50aWdhdGVwcmVzZXQiOiJB RyIsImV4dHJhcXVlcnkiOiIiLCJ1c2VzZXNzaW9ucyI6dHJ1ZSwibG9jYXRpb24i OiIiLCJzZXJwdGltZSI6IiIsImxpbmtzcGVycGFnZSI6MTAsImZpbHRlciI6dHJ1 ZSwic2VycCI6IiIsInVzZWFudGlnYXRlIjp0cnVlLCJwcm94eXJldHJpZXMiOiIx MCIsInJlcXVlc3RkZWxheSI6IjAiLCJwcm94eWJhbm5lZGNsZWFudXAiOiIzMDAi LCJyYXdkYXRhIjpmYWxzZSwiZm9ybWF0cmVzdWx0IjoiJHNlcnAuZm9ybWF0KCck bGlua1xcbicpIiwibHIiOiIiLCJtYXhfc2l6ZSI6IjIwNDgwMCJ9fX19 Для примера использован парсинг Google TOP10. За вывод результата в нужном виде отвечает шаблон: Скрипт для экранирования символов: Пример результата:
Хороший пример! Как то в хотелках предлагал прямую запись в БД (MySQL и sqlite) но что то все промолчали =(
будет, но сама по себе запись в базу не интересна, гораздо интереснее связанный с этим функционал(insert or update, сортировка результатов, отображение в парсере вьюшек, какая то аналитика и графики)
Сделать бы так для sqlite. Можно будет парсить апарсером на сервере а потом скармливать базу в ContentBox и генерить доры
PHP: INSERT INTO serp VALUES('слово', 'https://en.wiktionary.org/wiki/\%D1\%81\%D0\%BB\%D0\%BE\%D0\%B2\%D0\%BE', 'слово - Wiktionary')INSERT INTO serp VALUES('слово', 'https://ru.wikipedia.org/wiki/\%D0\%A1\%D0\%BB\%D0\%BE\%D0\%B2\%D0\%BE', 'Слово — Википедия')INSERT INTO serp VALUES('слово', 'https://ru.wikipedia.org/wiki/\%D0\%A1\%D0\%BB\%D0\%BE\%D0\%B2\%D0\%BE_(\%D1\%84\%D0\%B8\%D0\%BB\%D1\%8C\%D0\%BC)', 'Слово (фильм) — Википедия')INSERT INTO serp VALUES('слово', 'http://masterrussian.com/vocabulary/slovo_word.htm', 'How to say word in Russian - Translation and Examples - Word слово')INSERT INTO serp VALUES('слово', 'https://www.youtube.com/watch?v=dpfTJrUF2Nk', 'СЛОВО - ВИКТОР СУХОРУКОВ - YouTube')INSERT INTO serp VALUES('слово', 'https://www.google.com/search?q=\%D1\%81\%D0\%BB\%D0\%BE\%D0\%B2\%D0\%BE&num=100&hl=en&prmd=ivns&tbm=isch&tbo=u&source=univ&sa=X&ved=0ahUKEwiCxvHmuuHaAhWFFBQKHTh1AnkQsAQIOQ', 'Images for слово') https://www.google.com/search?q=\%D...X&ved=0ahUKEwiCxvHmuuHaAhWFFBQKHTh1AnkQsAQIOQ выводиться вот такая ссылка, где вместо слова - слово, такое \Ñ\ \Ð\»\Ð\¾\Ð\²\Ð\¾ Как сделать \Ñ\ \Ð\»\Ð\¾\Ð\²\Ð\¾, чтобы было слово?
Здравствуйте. Проблемы с кодировкой. А как вы эти строки получаете ? Код пресета в личку сбросьте. Telegram: @aparser2 Skype: Денис A-Parser Support
Я так понимаю, с текущей реализацией через JS парсеры, не стоит уже ожидать работу с БД в виде сортировки, вьюшек, аналитики и графики? Или все таки будет это реализовываться?