はてなキーワードAPI
Technoratiブログ検索で、鹿児島県内の地名や特産物に関するキーワードのクエリーを発行すると、該当するキーワードが記事エントリーに出現するブログのPermalinkを返してくれのだけど、いかんせん精度が悪い・・・
鹿児島に関する辞書やコーパスを持っていればいいのだが、メンテナンスするのも面倒くさい。ということで、一番安易な方法に頼ってみました。はてなキーワードAPIです。
naoyaさんのブログで、はてなキーワードAPIには、隠しモードで'lite'というのがあって、所与のテキストからキーワードを抽出してくれるようです。スコア(score)というパラメータで返すキーワードのしきい値を調整(重要語ほど値が大きい:0~100、20以上が目安)し、カテゴリ(cname)というパラメータリストで、地名(geometory)や食物(food)を絞り込むこともできます。
TechnoraiとはてなキーワードAPIをハックしたら、こんな感じになりました。左端に’鹿児島関連’がないブログは、はてなキーワードAPIからのキーワード抽出結果に検索ワードが返ってこなかったエントリーです。
ヒット精度は、90%くらいかな?
(米国の共用ホスティング環境で動かしているのでレスポンスが悪いのはご容赦を!)
最近のコメント