[programming-lab成分解析が流行ってるので作ってみた

最近、成分解析が流行ってますね。
http://tekipaki.jp/~clock/software/
http://seibun.nosv.org/


というわけで、作ってみました。

http://programming-lab.com/test/seibun/

但し、日本語未対応です。
半角英数字のみ入力してください。

言い訳を言わせてもらうと、
Yahoo!のWebサービス使って作ったのだけど、Yahoo!JapanのWebサービスが、まだ未対応なので、米国のYahoo!のWebサービス使ってる為です。

細かい技術的な話をすると、Yahoo Web Servicesの関連キーワード検索(relatedSuggestion)を使用しています。
これが、まだ日本に無いんですよね・・・。
あとは、プラスアルファの工夫というか、小細工をしてます。

つまり、あるものの成分はよく一緒に検索されるものだろうって考え方。勝手な発想ですが。

従って、検索結果が0件のものは、成分不明ということになります。



[例]
bushで検索してると、
http://programming-lab.com/test/seibun/index.php?query=bush

bushの解析結果

「bush」の38.2%は、「president」で出来ています。
「bush」の24.9%は、「george」で出来ています。
「bush」の13.7%は、「furniture」で出来ています。
「bush」の8.4%は、「george w.」で出来ています。
「bush」の6.1%は、「laura」で出来ています。
「bush」の4%は、「kate」で出来ています。
「bush」の2.5%は、「butterfly」で出来ています。
「bush」の1.1%は、「sophia」で出来ています。
「bush」の0.7%は、「jenna」で出来ています。
「bush」の0.4%は、「jeb」で出来ています。


結果も微妙ですね。
本家の成分解析より、現実的な回答が出るけど、本家の回答ほど面白くもない・・・
Read the rest of this entry »

Popularity: 2% [?]

Blog Widget by LinkWithin