18歳未満の方は入場をご遠慮下さい。

サーバーに保存のアクセスログを読む

 良性記は2012年10月からさくらインターネットのサーバーを使っている。
 さくらインターネットのサーバーの利用者はかなり多いらしいので、その利用者の中で、私よりもITに弱い人に多少は参考になるかもしれないと思って本稿をまとめ上げた。

 サイトの詳細なアクセスログがサーバーにあるけれど、私はそれを見ても文字化けするから利用することができず、さくらインターネットが用意している Webalizerのアクセス解析を使った。これは月末に月間値を確認するだけで、日々は解析ダグの設置によるアクセス解析を頼った。
 要するに、2012年10月から2019年11月まで私は自分のサイトの詳細なアクセスログを直接見たことは全くなかった。ところが2019年12月に至ってサーバーが記録するアクセスログを見たいという欲求を激しく強めることになった。
 そのわけは後述するが、とにかくログなるものと格闘しようと思った。
 それで、さくらレンタル アクセスログ 見方でググって調べたがわからない。『前日のログはgzipで圧縮されます』という文章をさくらのサイトで見たので、サーバーからaccess_log_20191130.gzの1日分のログを落とした。
 これをtext editorのTeraPadで開いても意味不明で、ファイルを右クリックしても『解凍』のような案内が出ないから、諦めてゲームを始めた。ふとgzipの展開でググったら何か出るのではないかと思ってやってみた。
 筆頭掲載のgzip - ファイルを圧縮・展開 - Linuxコマンドを眺めたが、Linuxコマンドではさっぱりわからず、途方に暮れるだけだ。
 諦めてゲームに戻ったが、どうにも癪だ。Windows環境で使用できる、gzip形式の圧縮・解凍ソフト -FAQというものを見つけ、これを眺めた。
 それで、日本語サイトsevenzip.sourceforge.jp/を怖々開き、その中の7-Zip File Managerをあまり意味がわからぬままこれまた恐る恐るダウンロードした。
 7-Zip 19.00(2019-02-21) for Windows の説明:高圧縮率のファイルアーカイバ(圧縮・展開/圧縮・解凍ソフト)です───とあった。
 OKボタンを押して、7-Zip とやらを立ち上げようとしたが、やり方がわからない。ダウンロードのフォルダを見ても exeファイルがない。いろいろ見てもさっぱりわからないから、諦めてゲームに戻った。
 そこで、スタートボタンを押せば何かあるのではと気づいて(私はPCの終了と設定以外ではこのボタンを左クリックしないから気づいたのが不思議だ)クリックすると、7-Zip があった。
 しめしめとプログラムを起動したけれど、ここでまた途方に暮れた。access_log_20191130.gzの展開方法がさっぱりわからない。いろいろやってとうとう諦めた。
 ゲームに戻ってから気がついた。圧縮の操作しかできないのはそういう画面だからであって、展開の操作の画面が別にあるのでは、ということだ。果たして、展開の画面が別にあった。
 そこにドロップして展開に成功し、とうとう11月30日の1日分のアクセスログの中身がわかるようになった。textファイルなのに 6,078KBもあるものすごいファイルだ。
 このでかいファイルを調べても、(不審だから探したい)と思ったアクセスデータが見当たらなかった。知識が乏しくてとても苦闘して良いところまでたどり着いたけれど、残念ながら疑問は解決されない。
 それにしても、さくらインターネットのサイトのどこにもgzファイルの展開方法が示されていない。IT関係者には自明のことなのかねえ。アクセスログを見やすいように整えるツールも示されていない。あっても良さそうなのに、どういうことなのかと思う。私にそのような能力はない。

 アクセスログを調べたいと思ったわけは次の通りだ。
 2019年02月01日の日記に「/img/hというアクセスがわからない」ということを書いた。これはサーバー側のアクセス解析の Hitの集計に現れるだけで、タグ方式のアクセス解析にはそれらしきものが出てこない。画像にタグをつけられないから画像へのアクセスはわかりようがない。嬢の画像のフォルダだけに現れるから検索ロボットの巡回は無関係のようだ。
 とにかく/img1/hという名のファイルはないのに/img1/hのアクセスが異常に多く、これがいかなるアクセスかわからないから腹立たしくて、この時妨害を意図して/img1を/img3に変えた。
 しかし、この対策は効果なく、/img3/hの名のファイルはないのに Hitの集計表で/img3/hというアクセスがやたら多い現象は同じで、その後毎月同じ状況だ。
 2019年11月の1ヶ月間のヒット数を見ると
 トップページ10,855件、えろえろ考察の入り口3,872件、/img3/h 3,598件
の通り、/img3/hのアクセスが多い。それで、11月30日に/img3を/img4に変えた。ただ、img/3のフォルダも中身も残したままにした。
 12月の/img/hのアクセス状況は次の通りだ。
11月30日 12月1日 12月2日 12月3日
img3/h 当日分不明 16  13 
img4/h 120  140  121  132 
 img3/hの11月のHit数の日割りが120となるから、11月30日からちゃんと目標をimg4に変えている。
 12月の3日間で、img4/hはHit数393、送信した量27,518KB。Hit数で割り算すると70KBだから、これは画像1枚当たりの数値に当たり、3日間で393枚の画像を落とした計算になる。なお、img4フォルダの画像のファイル数は180だ。
 img4を使ったのは激写シリーズ以外のすべての作品で、激写シリーズだけ12月初旬まではimg3のままとした。両者は全く同じ画像が置いてある。
 img3をimg4に変えたことに追従して、画像を読み込む個所を変えているのはどういうことなのだろうか。
 AV女優の顔写真専用のフォルダーや非猥褻系画像のフォルダを無視している。このように対象フォルダをしっかり把握しているのに、img2/hがないのが不思議だ。img2/はimg4/とほぼ同量の画像が置いてあるにもかかわらずimg2/hがない。
 img3/hのアクセスが腹立たしいからimg4に変えたのに効果なしだから憂鬱だった。
 img4/hのアクセスが何かわかるためにはサーバーにある日々のアクセスログが読めないとだめだとつくづく悟った。
 それで、検索で調べた情報をもとに何とかアクセスログが読めるようになったけれど、img4/hのもととなるアクセスが発見できなかった。苛立ちは募るばかりだ。

えろえろ考察  トップページ
(千戸拾倍 著)