HOMERSSサイトマッププロフィールお問い合せ

2007年1月27日

Apache の設定ミスで意図しなかったデータがネットに顔を出していた

最近ではブログのテキスト検索機能を当てにしてメモの類も書き込み始めている。その中でネットに公開できないものは Apache の設定でIPフィルタをかけていたのだが、どうも設定が旨くいっていなかったようで意図しなかったものがネットに公開されていた。

内容は個人情報など重要なものではなく退職手続きの煩雑な私的メモの類だが、一ヶ所会社固有の書類名が入っていた。

総務担当からの指摘で確認したところミスが判明したので訂正した。

ところが・・・ネットの検索エンジンに引っかかりキャッシュされていることが分かり、削除すべく早速手を打った。

(手順)

1). キャッシュされているページの <HEAD> セクションに

    <META NAME="ROBOTS" CONTENT="NOARCHIVE">

    を挿入する。また、Google だけを禁止するのなら
    <META NAME="GOOGLEBOT" CONTENT="NOARCHIVE">

    ・・・と挿入

2). 通常、1) の設定をしておけば次の検索ロボットがサイトにきた時に削除されるが、Google は緊急削除の依頼が出来るようなので折角だから依頼しておくことにした。

    Google のアカウントを取得した上で、ここからログインして URL などの指定をすると 24時以内に削除されるようだ。

    確かに依頼を出して 24時間内に削除されていることが確認できた。さすが Google、Yahoo さんはどうすんのかな???


本来、検索キャッシュの役割はインデックスURLのサイトがダウンしていた時などの代替として機能するものだと思うが殆ど意味をなさないように思う。


そこで、、、当ブログも折を見てキャッシュレスに設定しなおすことにした。

投稿者: 管理者 日時: 2007年1月27日 19:15 | パーマリンク |TOPページへ   ▲画面上へ

トラックバック

このエントリーのトラックバックURL:
https://bit-consul.net/cgi-bin/MT/mt-tb.cgi/212

コメントを投稿

(いままで、ここでコメントしたことがないときは、コメントを表示する前にこのブログのオーナーの承認が必要になることがあります。承認されるまではコメントは表示されません。そのときはしばらく待ってください。)