Demo OpenShared
コレWordPressデス

WordPressのLogを確認して気がついたこと

posted:

このサイトはアクセス解析をするためのサービス(Google AnalyticsやYandex.Metrica他)は利用していないのでlogからJupyterでチェックしてみました。

まだ、二週間くらいなので検索からの流入は少ないのは当然なのですが、access_Logからの解析は所謂サイトのアクセス解析(Google AnalyticsやYandex.Metrica他)とは違うことを改めて再認識しました。WordPressなどのCMSを使う人は何が動いているか見ておいた方が良いと思います。

import apache_log_parserでlogを整形してcsvに保存します。
今回は容量も少ないので今後のために一旦Excelでチェックしました。

ちっとも面白くないデータでほとんどが/wp-admin/でした。

Jupyterを使ってデータを紐解く

簡単なことしかできないのでCSVデータを読み込んで処理します。

リクエストされたページの要約データ

df_requests[‘request_url_path’].describe()
count 6896
unique 805
top /wpf/wp-admin/admin-ajax.php
freq 1385

デイリーのリクエストページの要約データ

df_page[‘request_url_path’].resample(‘D’).count()
date
2020-03-01 183
2020-03-02 403
2020-03-03 132
2020-03-04 287
2020-03-05 143
2020-03-06 288
2020-03-07 0
2020-03-08 0
2020-03-09 144
2020-03-10 169
2020-03-11 291
Freq: D, Name: request_url_path, dtype: int64

デイリーのリクエストデータ容量

df_page[‘response_bytes’].resample(‘D’).sum()
date
2020-03-01 2,917,269
2020-03-02 6,293,336
2020-03-03 2,039,535
2020-03-04 3,688,210
2020-03-05 2,241,515
2020-03-06 2,544,808
2020-03-07 0
2020-03-08 0
2020-03-09 1,585,581
2020-03-10 2,283,485
2020-03-11 2,829,823
Freq: D, Name: response_bytes, dtype: int64

2020-03 AccessLog

メンテナンスが必要な仕様

WordPressはPostデータが多くなるので記事を多く書く場合はメンテナンスが必要だと感じました。思ったより/wp-admin/へのアクセスが多かったです。

記事の入力に慣れていないこともあるかもしれませんが、アクセスの多いサイトは編集時間を工夫するのが良いかもしれません。表向きなプラグインじゃなくて管理用のプラグインを探してみます。取り急ぎはRevisonのコントロールあたりを

Jupyterでのimport apache_log_parser

これもちょっと列が増えすぎて扱いにくいので別の方法を考えることにします。