2008年7月28日月曜日

Pathtraq API 試し打ち

の方法は「Do You PHP はてな」ブログから。
これでばっちりデータがとれているのが確認できました。

前述のリンク先の見本を実行するには、PHPでPathtraqのPEARモジュールを作られていたので、それをCodeReposからDLしてサーバのPEARディレクトリに配置しておきます。

取得データ内でAPIの適用されている箇所は、黄色のラインマーカーの箇所。






















ソースではキーワードを渡してあげるだけで良く、Web上アクセス履歴や遷移先の統計をするのに便利ですね。


その他にもid:amachangさんが、至れり尽くせりのAPI使用法を上げてくれているので、JavaScript&JSONでも試してみたいです。
なお、リクエストパラメータのカテゴリの定義などは公式ドキュメント参照のこと。


そういえば、検索とユーザの閲覧履歴についてはMicroSoft も BrowserRank(下図転載) というアプローチを検討しているとF.Ko-jiさんのブログにあったのを思い出しました。
(さらにはMicroSoftのPowerSet買収の件も気になるところです‥)













2008年はセマンティックWeb元年とのことですが、その背景には検索技術向上の競争が繰り広げられているのだと感じました。。

2008年7月25日金曜日

MicroSoftの3D Software "trueSpace"

が無償公開されたとのことです ⇒ Webマーケティングブログ記事

Google SketchUpでも驚いていたのですが、MicroSoftも気風が良いですね(本来$595=6万円相当で販売されていたそうで‥)。

XBoxで実装されている技術の一端を味わうことができればラッキーです。

















3Dモデリングソフトの価格破壊を通り越して、無償ツールの台頭が来るとは‥。。
とにかく市場シェアを制したいという意思が強烈に現れてますね。

2008年7月24日木曜日

TermDrips API の試し打ち

Yahoo!Developer APIにも形態素解析用のAPIがあるのですが、たつをさんブログのTF-IDF利用など、検索技術関連のネタを漁っています。

英語ならアルファベット26字と半角数字記号の世界ですが、いざ日本語となるとカタカナひらがな漢字+英語圏のそれと合わせたテキストデータの取り扱いが必要ですよね。。

解析技術の難易度が言語に依存するところや、文字エンコードなどは調べるのも面白いのですが、今回は課題に使えるようなAPIを探索。

「キーワード抽出&重みづけ」を実行可能なAPIのうち、見つかった "KOSHIAN" は現在利用不可とことだったので、 "TermDrips"APIを使ってみようと思います。

キーワードを定義するにはベースの辞書が必要ですが、ここではWkipediaを。
また、カテゴリ情報の定義も同じくWikipedia、キーワードの重みづけにはMeCabを利用しているとのこと。
(重みスコア = コスト×キーワード出現回数、コストはMeCabの仕組みから)

なお、XML経由での使用法は「熱血multi web」ブログ記事を参照。


POSTして返ってくるデータ例は以下のような感じ。
































より記事内容の即しているキーワードの重みづけがされていることが見て取れます。
直感的にWebテキストデータを把握する上で便利ですね。


さらに検索技術を深堀りしたいと思っていたので、参考資料を後述。。
  • たつをさんChangeLogのIIR輪講記事(introduction to infromation retrieval)
  • &なおやさん輪講まとめppt格納庫

  • オライリー出版「集合知プログラミング」
     ベイズ理論とか決定木とかニューラルネットワークなどなど話題豊富な1冊です。

2008年7月18日金曜日

Firefoxアドオン DB管理ツール

Firefox add-on の便利ツール ”SQLite Manager

PHPにはローカルのGUIで動かせるphpMyAdmin がありますが、SQLite用でこれは使えそう。

GoogleGearsのデータもここで使えるように設定しとこうかと。
シンプルなレイアウトでメニューも直感的に使えるような具合になっています。



 


























TechCrunch記事にもあったように、オフライン化としてのツール以上に、GoogleGears(Gearsに改名されたそうですが)はWebアプリの処理速度向上に有用とのこと。

確かにシンクライアント環境が整ってきてはいても待機時間が大きいのはストレスですし。
Gearsと相性の良さそうなSQLiteツールは歓迎です。

2008年7月17日木曜日

今日の人気記事@はてなからの備忘録

秀逸な記事(ともにWebサービス紹介)が並んでたので備忘録。


1つ目は be funky
画像ジェネレータのサービス

生成されるスタイルは3種類「水彩画風」「マンガ風」「動画切り出し画像」です。
コミカルな画像のジェネレータは数あれど、このWebサービスは提示の仕方が抜群です。

加工するのもスライドバーで調整する、クリップを乗せる・貼る。
GUIで自由自在。

E-mailで誰かに送ったりデスクトップ、内部のSNSや自分用ギャラリーにも保存OK。
使いやすさが極まったサービスです。


(Before)











こんな感じのものを生成。

(After)












2つめは、id:gamellaさんブログ紹介記事 "Tombloo"
Firefoxの拡張機能です。

Tumblr.という画像、映像、音声ファイルなどを簡単にアップできる機能に特化したWebサービスがあるのですが、これの補足用拡張機能として作られたとのことです。(FirefoxのエクステンションはJavaScriptで作れるそうで‥)

ただ、この"Tombloo"の優れた点は、自分が利用しているWebサービスに投稿、登録、ポストできる対象の幅の広さです。

ざっと見ただけでも
  • Tumblr
  • FriendFeed
  • FFFOUND
  • Flicker
  • WeHeartIt
  • 4u
  • (local フォルダにも)
  • Twitter
  • del.icio.us
  • Firefox bookmark
  • GoogleBookmark
  • Yahoo!Bookmark
  • HataneBookmark (HatenaStarも)
  • Wassr
とツボをしっかり押さえています。
個別にアップしなくても済むことで横断的なサービス利用の手間が省けるのです。


ソーシャルブックマーク(SBM)研究会から感じたことで、SBMはコミュニティの性質に依存して、その中で成長する過程があるのではないか。
SBMの用途ごとの使い分けが求められるのではないかという思いがあります。

このTombloo がSBMを横につなげるパワフルなツールは是非使ってみたいです。

Blogger Syntax Highliter