アクセスログ分析
1999 年 11 月に行った、Live! Leonids 99 のWWWサイトへの時間単位のアクセス推移です。
注意
- live.leonids.net は DNS の Roud robin によって live1,live2 の2つの Web サーバに振り分けられます。
- 縦軸が転送バイト量などで、横軸が日と時刻 (15_04は11月15日の午前4時を意味する)です。
- 全てのバイト量計算は HTTP サーバが吐き出したログから採集していますので、分単位ではあまり正確ではありません。特に大量データの転送の場合、タイムスタンプがいつのものかが問題となるでしょう。
全体トラフィック
10分毎の各サーバのヒット数。
10分毎の各サーバのバイト転送量。
- 期間中の合計では 167 万ヒットのアクセスがあった。
- 10 分のヒット数合計で 25,000 hit/10min = 41 hits/sec が最大、
分単位では 17 日 23:10 分前後の 2700 hits/min = 45 hits/sec あたりが
ピークである。
- バイト転送量はヒット数とほぼ同じカーブを描く。
- 同じくピーク時の 10 分合計では 100MB/10min = 166KB/sec = 1.3Mbps が最大、
分単位では 11.3MB/min = 188KB/sec = 1.5Mbps あたりとなる。
- 上記のトラフィックを二台のサーバでほとんど均等に二分しているため、
各サーバへの最大負荷はそれぞれ上記の半分となる。
- 後の分析でもわかるが、このピークの発生は日本からのアクセスによるもので、
テレホーダイに合わせたアクセスの傾向を反映したものであろう。
地域ごとのアクセス推移
アクセスログの IP address 部分を逆引きした情報のカントリードメイン情報を
もとに、アクセスがどの地域から来たか類推し、地域ごとのアクセス推移を
調べてみた。
地域の分類は非常にざっくりと下記のようにした。
- Japan AREA
- jp
- COM AREA
- com, net, org
- US AREA
- us, edu, gov, mil, ca, mx
- Europa AREA
- uk, es, fr, de, nl, it, ch, at, se, dk, fi, lu, ie, pt
com, net, org ドメインは地域的な意味合いが薄い点に注意。
厳密な分類ではなく明らかに地域性がありそうな部分からのアクセスの
傾向を見る。本来的には AS 情報などを見るべき。
また、トラフィックの大勢を jp ドメインからのアクセスが占めているため、
余り有効な推定ができない状態ではあるが、とりあえず。
10分毎のアクセス地域別ヒット数。
日本を含めない場合。
全体的に日本からのアクセスが主であるが、18日の朝から夜までは
海外からのアクセス、特に COM エリアが増える。
US と EU 地域のシーソー的推移が興味深い。
縦軸を全体のヒット数に対してそれぞれの地域からのアクセスが
占めるパーセントで示してみる。
グラフ左側がサンプル数が少ないために安定した値になっていない点に注意。
地域別パーセント
ご意見、ご質問などは yasuda@bakkers.org までお願いします。
2000.1