はてなブログの管理画面(ダッシュボード)のアクセス解析ページの内容を読み取り、日々記録していくという作業を始めます。
ソースコードから特定のタグを取り出していく方式で進めていきたいと思います。
きょうは、ソースコードから欲しい情報が読み取れるのかを確認していきます。
取得したいのは、よくアクセスされている記事タイトルとURL、パーセント値です。
最近のアクセス傾向という表示で、上の例では「Googleからアクセスされているページ」の様子ですが、このページのソースコードを確認すると、閲覧するときは、クリックして表示を切り替える必要のある他の検索サイトからの情報も全て1つのソースコードで見ることができました。
上のページの赤で囲んだ情報は、ソースコードの以下の場所で確認することができます。URL情報もあります。
手順としては、このページをオブジェクト化して、各種タグにはさまれた、テキスト部分を抜き出していきます。
Excelシートに出力して、パーセント表示を実際のアクセス数に直したり、順位をつけたり、また日付順に並べていったりということをやっていきます。
ページ内のボタンをクリックしたり、チェックボックスをつけたりする必要は無いので楽にできる予感がします。
ただ、ページの読み取りは自動ですが、このアクセス解析ページの読み取り実行は毎日人力でやる必要があります。web上で実行してwebで完結!っていうふうにできればいいのですが。
また、集計結果をExcelシートで、自分でローカルに保存するだけでなく、公開もしたいです。毎日の作業をどうやっていくか・・・ そのへんの操作がまだ見えてないです。
毎日やる必要もあるのか・・・とか。
明日以降・・・に続きます。