snuffkinの遊び場

IT関係、スポーツ、数学等に関することを、気が向いたときに書いてます。

10番目の鈴木はこの人だ!

「鈴木」という文字を含むはてなキーワードGoogleで検索して、検索結果数の順に並べるpythonアプリを作ってみました。その実行結果は、以下の通り。カッコ内は、検索結果数。

    1. 鈴木一誌(693000)
    2. 鈴木一真(646000)
    3. 鈴木英人(573000)
    4. 鈴木武一(440000)
    5. 鈴木力 (392000)
    6. 鈴木美生(387000)
    7. 鈴木成高(374000)
    8. 鈴木明 (372000)
    9. 鈴木先生(371000)
    10. 鈴木秀人(366000)

う〜ん、大嘘ですね、こりゃ。知らない鈴木さんばかりなんですけど。
Google AJAX Search APIを利用して、返って来たestimatedResultCountの値を利用しているのですが、この値が普通にGoogleで手動検索した値と違いすぎです。以下のページのような報告もあるし、こりゃ使えないですね。

Google Ajax Search APIで検索結果数を取得(したけどかなりあやしい)

手動検索と同じURLにアクセスして、返って来たHTMLをパースするのが正解なのかな…