自分方位研究所

日々の活動記録

はてなブログ アクセス解析ページのソースコードを確認する。

はてなブログの管理画面(ダッシュボード)のアクセス解析ページの内容を読み取り、日々記録していくという作業を始めます。

ソースコードから特定のタグを取り出していく方式で進めていきたいと思います。

きょうは、ソースコードから欲しい情報が読み取れるのかを確認していきます。

取得したいのは、よくアクセスされている記事タイトルとURL、パーセント値です。

f:id:k-emu:20210304225757j:plain

最近のアクセス傾向という表示で、上の例では「Googleからアクセスされているページ」の様子ですが、このページのソースコードを確認すると、閲覧するときは、クリックして表示を切り替える必要のある他の検索サイトからの情報も全て1つのソースコードで見ることができました。

 上のページの赤で囲んだ情報は、ソースコードの以下の場所で確認することができます。URL情報もあります。

f:id:k-emu:20210304225813j:plain

手順としては、このページをオブジェクト化して、各種タグにはさまれた、テキスト部分を抜き出していきます。

Excelシートに出力して、パーセント表示を実際のアクセス数に直したり、順位をつけたり、また日付順に並べていったりということをやっていきます。

ページ内のボタンをクリックしたり、チェックボックスをつけたりする必要は無いので楽にできる予感がします。

ただ、ページの読み取りは自動ですが、このアクセス解析ページの読み取り実行は毎日人力でやる必要があります。web上で実行してwebで完結!っていうふうにできればいいのですが。

また、集計結果をExcelシートで、自分でローカルに保存するだけでなく、公開もしたいです。毎日の作業をどうやっていくか・・・ そのへんの操作がまだ見えてないです。

毎日やる必要もあるのか・・・とか。

明日以降・・・に続きます。