結果コンストラクター

Result Builders (結果ビルダー) - 各スクレイパーからの結果をフォーマットしてディスクに保存する前に変換することができます

機能

検索エンジンからリンクをスクレイピングする際に、ドメインのみを保存する：

ソースとして、最初のスクレイパーのserp配列内のlink要素が使用されます。各要素にリンクからメインドメインを抽出する関数が適用され、新しい結果は同じ名前（serp配列内のlink要素）で保存されるため、結果フォーマットを変更する必要はありません。

HTMLタグを削除し、HTMLエンティティを変換して、検索エンジンからスニペットを保存する

デフォルトでは、アンカーとスニペットはすべてのネストされたタグを含めてスクレイピングされるため、検索エンジンの検索結果を表示する際と同じフォーマットを維持できます。プレーンテキストのみが必要な場合は、結果ビルダーの機能を利用できます：

この例では、スニペットに対して「HTMLタグの削除」と「HTMLエンティティの変換」の2つの結果ビルダーが順次適用されています。

XPathを使用して検索結果からリンクをスクレイピングする：

この例では、Google検索エンジンからのリンクのスクレイピングを示しています。以下のXPathクエリが使用されています：

//*[@id="rso"]/div[3]/div/div[1]/a/@href