2008年5月18日日曜日

Yahoo!Pipes 作成中

デフォルトでは、Google検索・Yahoo!サーチともに日本語での検索結果をRSSで受け取るpipeは用意されてないので作成中。

正規表現試しながらなのでペース遅いです。

いやはや、全文検索(自然言語処理)のPowerSetのPipesができてたのは焦り。



過程で参照しているサイトは下記にて。

PipesからのRSSの作り方がわかりやすいフロー

Yahoo!Pipesモジュール和訳一覧

Fetch Pageの用法
各モジュールとFetchPageの組み合わせ方

Regrexでタイトル置き換え

PipesからJSONPで出力(roopの使い方も)

正規表現用法

Regrexモジュールのチェックボックスには言及が少ないので転載。

  • gオプション:繰り返してマッチを行う
  • sオプション:ワイルドカードのドット( . )が改行にもマッチするようにする
  • mオプション:対象のパターンに改行が含まれていても、その改行にまたがってパターンを検索する
  • iオプション:大文字と小文字を区別しないでマッチングする


以前の話し。。
Saerch&RSS経由で前述の検索結果を拾うPipeを作ってみたものの、返ってきたRSSのtitle,descriptionの文字化け問題が解決できず断念。。

今回は直接検索ページから抜き出したので文字化けはおそらく起きないはず(UTF-8で統一)。

0 件のコメント:

Blogger Syntax Highliter