[programming-lab] 成分解析が流行ってるので作ってみた
最近、成分解析が流行ってますね。
http://tekipaki.jp/~clock/software/
http://seibun.nosv.org/
というわけで、作ってみました。
http://programming-lab.com/test/seibun/
但し、日本語未対応です。
半角英数字のみ入力してください。
言い訳を言わせてもらうと、
Yahoo!のWebサービス使って作ったのだけど、Yahoo!JapanのWebサービスが、まだ未対応なので、米国のYahoo!のWebサービス使ってる為です。
細かい技術的な話をすると、Yahoo Web Servicesの関連キーワード検索(relatedSuggestion)を使用しています。
これが、まだ日本に無いんですよね・・・。
あとは、プラスアルファの工夫というか、小細工をしてます。
つまり、あるものの成分はよく一緒に検索されるものだろうって考え方。勝手な発想ですが。
従って、検索結果が0件のものは、成分不明ということになります。
[例]
bushで検索してると、
http://programming-lab.com/test/seibun/index.php?query=bush
bushの解析結果
「bush」の38.2%は、「president」で出来ています。
「bush」の24.9%は、「george」で出来ています。
「bush」の13.7%は、「furniture」で出来ています。
「bush」の8.4%は、「george w.」で出来ています。
「bush」の6.1%は、「laura」で出来ています。
「bush」の4%は、「kate」で出来ています。
「bush」の2.5%は、「butterfly」で出来ています。
「bush」の1.1%は、「sophia」で出来ています。
「bush」の0.7%は、「jenna」で出来ています。
「bush」の0.4%は、「jeb」で出来ています。
結果も微妙ですね。
本家の成分解析より、現実的な回答が出るけど、本家の回答ほど面白くもない・・・
Read the rest of this entry »
Popularity: 2% [?]






