サイトのキーフレーズを抽出するサイトを作ってみた

Yahoo!がキーフレーズ抽出APIをだしていたので、URLを入力すると本文をとってきて、本文のキーフレーズを表示するサイトを作ってみた。

http://steel-plate.jp/keyfraze/

仕組み

まず、以下のページで書いている方法で、本文を抽出する。

ブログやニュースの本文を抽出する方法 - 僕のススメ。

で、取得した結果をキーフレーズ抽出APIにかけて、結果を表示している。

Yahoo!キーフレーズ抽出APIの例

一応簡単サンプルとして、キーフレーズ抽出APIの例を書いてみる。

<?php
    // キーフレーズ抽出
    $aid = あなたのAPI ID
    $content = キーフレーズを抽出する文章

    $url = "http://jlp.yahooapis.jp/KeyphraseService/V1/extract?appid=".$aid;
    $url .= "&sentence=".urlencode($content);
    $xml  = simplexml_load_file($url);
    foreach ($xml->Result as $cur) {
        echo $cur->Keyphrase."".$cur->Score;
    }
?>

上記プログラムで、$contentに入力されたキーフレーズが抽出できる。APIを使用する上での注意点としてURLエンコーディングを行う必要があるってこと。そうしないと、Yahoo!APIがきちんと認識することが出来なくて拒絶してしまうみたい。

まとめ

Yahoo!が最近熱いね。面白いAPIをよく出してる気がする。今回は非常に簡単なプログラムだけど、これを使ってもうちょっと複雑なものを作ってみようかと思ってる。