正規表現試しながらなのでペース遅いです。
いやはや、全文検索(自然言語処理)のPowerSetのPipesができてたのは焦り。
過程で参照しているサイトは下記にて。
・PipesからのRSSの作り方がわかりやすいフロー
・Yahoo!Pipesモジュール和訳一覧
・Fetch Pageの用法
・各モジュールとFetchPageの組み合わせ方
・Regrexでタイトル置き換え
・PipesからJSONPで出力(roopの使い方も)
・正規表現用法
Regrexモジュールのチェックボックスには言及が少ないので転載。
- gオプション:繰り返してマッチを行う
- sオプション:ワイルドカードのドット( . )が改行にもマッチするようにする
- mオプション:対象のパターンに改行が含まれていても、その改行にまたがってパターンを検索する
- iオプション:大文字と小文字を区別しないでマッチングする
以前の話し。。
Saerch&RSS経由で前述の検索結果を拾うPipeを作ってみたものの、返ってきたRSSのtitle,descriptionの文字化け問題が解決できず断念。。
今回は直接検索ページから抜き出したので文字化けはおそらく起きないはず(UTF-8で統一)。
0 件のコメント:
コメントを投稿