暇つぶしのエントロピー

暇つぶしに何して遊んだか記録していく。少し続いたと思ってたら更新飽きた!最近は工作ブログになりつつある。

webalizerで検索文字列の文字化け対策

  • 4月
  • 22

11:09 pm シロクマ

いままでログの解析をしていなかったけど、検索してきたやって来た人の検索語が気になったので解析を行うことにした。
ログ解析のソフトはいくつもあるけど検索して見つかったwebalizerを使うことにした。
ダウンロードして configure して make して make install 。
(configure では日本語をオプションで指定しています。)
早速解析。
おいおい検索文字列が文字化けしてるぞ。

bake
ブラウザのエンコードをUTF-8にしたら“うぉ~ちゃんと見える!”
私が直面している問題は過去に先に直面した人がいて後人のためにページを作ってくれているはずなのでとりあえずググってみた。
めっけた。
Webalizerで検索語の文字化けを解消
perl でなんかやってるけど面倒だなぁ….

なんとなくブラウザでソースを確認してみた。“うぉ~シンプルなヘッダだ。content-type 吐いてねぇ!”

あっそうだ。日本語の定義ファイル、UTF にしちゃえばいいじゃん。
日本語の定義ファイルは….あった。
lang/webalizer_lang.japanese
バックアップして nkf で UTF-8 に変換。

>mv lang/webalizer_lang.japanese lang/webalizer_lang.japanese.euc
>nkf -E -w8 lang/webalizer_lang.japanese.euc > lang/webalizer_lang.japanese

あとは make して make install して実行。
matomo
文字化け解消!

検索文字列が EUC のサイトから来たりすると文字化けはやっぱりおきるけど、あまり見かけないしこの方がシンプルだし簡単!

と久しぶりのコンピュータネタでした。

ちなみにうちのサイトを一番見に来ているのは、Google さんでした。マメすぎ。


© 2007 暇つぶしのエントロピー. Blog theme by blogstheme.com, debt consolidation.