よもやまページ
このページの内容は、書式や方向性など決めず書きたい事を書いては消す可能性があるため 1 度ご覧頂いた内容を再度見返そうとされた際に元々の文章や意図などが書き変わっている、あるいは無くなってしまっている場合がございます事にご留意ください。
WISE.JP という独自ドメイン名について
これはかつて HPSEEK.COM という検索エンジンを制作運用していた頃、HP と SEEK という比較的普遍的で違和感無さそうな文字列を 2 つ繋げて HPSEEK のつもりが、エイチピーシークだかホームページシークなんだか一目で読み方が解らんだろなという名付けの失敗を意識していた頃、偶然ながら某所ドメインオークションにて出品されていた wise.jp という独自ドメイン名を無事落札したものであり、後付けで Website Information Search Engine の略で WISE って事にしようかなどと思い浮かべこそしていたものの、決して他社の権利侵害等を画策したものではない事を表明しておきたいものであります。
しかし現在の WISE.JP の前身である HPSEEK.COM を事実上閉鎖してしまって以来 10 年以上何もして来ず、それを今更 2025 年 12 月に WISE.JP として再公開した時点でおそらく当時には無かったと思しきウェブサービスや製品に WISE の名称が見られ、時系列的に最後発で WISE を名乗るウェブサイトを運用するつもりである者としましては色々と肩身の狭い心地の限りではありますが、かつてそう作りたかったけれども作り切れず、そして今更それを作り公開したからには、これからもずっと続けてゆきたいと思っておりますのもまた素直な所であります。
では今更何をしたいのかというと
かつて制作運用しておりました HPSEEK.COM につきましても、当時の流行りであった Yomi-Search をポン置きや改良したものでは無くゼロからフルスクラッチしたものでありましたが、当時もそうですが今日現在までも職業プログラマーでもスクリプターでも何でも無い趣味のウェブスクリプティングを嗜んでいた程度の者にとって最も高い壁というのが「どう設計して良いか解らない」というもので、具体的には負荷の低いフリーワード検索機能というものをどうしても自力で設計作成できず、かといってどっかから拝借して来るという事もせず、ただ朧気には新しい検索エンジンは作りたいけれども作れないという月日だけが流れてしまっていた所でありましたが、
日付としましては「誕生日: 2025-10-15」とメモしておりますが、別件で別スクリプトを作成し私用するにあたり、雑多で煩雑なメモ書きファイルの中から必要な情報を探す際にどうしてもフリーワード検索機能が必要になり、先述の通り今の今まで避けて逃げまくっていたものを今更どうして作成する事が出来ようか、という心の中だけの葛藤のままに取りあえず最低限動く様に・使える様に作ってみようと実際に作ってみたら想像以上の検索速度が出たものだから、ああ、これなら検索エンジン出来るじゃん・・・となり、そして以後という流れとなりました。
いつまで経っても初級者の域を出ない者が作れるスクリプトなんて高が知れておりまして、何を小難しい事とか天才的な事をスクリプティング出来ている訳では無く、その実体はテキストファイルの中から特定の行だけ抜き出しているだけという文字列検索スクリプト、それを如何にかつてその名称で呼ばれたディレクトリ検索エンジンとして振舞わせられるか、如何に高負荷状態まで耐えられさせられるか、如何に自らがそう作りたい様に制作し運用して行けるか、完成品のご披露というよりも多分ずっと続けたい実験の場を今一度、今更設けたというのが正確な所かと思われます。
現時点で出来ること
ディレクトリ検索
これはかつて知られたディレクトリ型検索エンジンの通り、各ディレクトリ (カテゴリ) に配置されたウェブサイトをディレクトリ名で辿って行く方法ですが当初はこのディレクトリ検索を設けず後述ハッシュタグ検索機能のみの「ハッシュタグ型検索エンジン」を称する検索エンジンとしようと思っていたものを結局ディレクトリ検索機能を再度追加したものとなります。
Yomi-Search 等、従来の既成スクリプトであれば予め用意しておいたディレクトリ名を希望選択してデータ登録、というものかと思われますが、WISE.JP では基本的にプリセットのディレクトリ名リストは存在せず、任意の文字列から理屈上はディレクトリ階層の制限なし、登録先ディレクトリ数制限なしで対象となるディレクトリパスとページを自動生成し、これを検索結果として表示いたします。
ハッシュタグ検索
その実体はサブ階層を設けない完全一層のディレクトリ検索とでも呼ぶべきものですが、サブカテゴリが細分化せざるを得なくてサイトを探そうにも実際には掘りづらいだけじゃね?としか思わなかった従来のディレクトリ型検索エンジンに対し、直感的に選べてサブカテとかいう導線が存在しないディレクトリ型検索エンジンというものが絶対に必要、だとその一存でしばらくその通りに作ろうとはしたものの、単にタグ名だけ選んでページ開かせてサイトとリンク先が居並んでるだけならそれってブログでやれば良くね?と思い、今更検索エンジンを自作する者としてはブログには代えられないアイデンティティを担保するべく、先述のディレクトリ検索機能を再追加したものとなります。
キーワード (フリーワード) 検索
当時からしてみても、ディレクトリ型検索エンジンを称するウェブサービスなればキーワードで検索する機能なんてのは添え物程度で良くね?まあ最低限の事さえ果たせれば、とは思えども実際のところ一連の機能と処理の中では段違いに処理が重く負荷が大きく、可能性としてこの泣き所に対してイタズラされてしまう事に対しての防御策たるスクリプトの設計と実装方法が思い浮かばず当時の HPSEEK.COM の頃から直近に至るま何もして来れなかったという言い方が出来るところでありましたが、まあ詳細を詳らかには出来かねますものの現 WISE.JP におきましては嘗ての懸念点に対してのセルフ回答となる実装となっております。
ただまあ低機能で最低限の事しか出来ず、形態素解析などそっちのけでただ入力された文字列を用いた文字検索、空白文字があればそれで区切って複数語による全一致検索も可能ってだけの代物でしかないものでありますが、対象となるテキストファイル内から特定行を抜き出すというシンプルな実装ゆえに非 DB、検索エンジン本体となるスクリプト自体をレンタルサーバに置くだけで済むものであるため特定のレンタルサーバに根を張る運用をせずに済み、仮住まいや移転先を基本選ばないといった利点を享受するものとなります。
その他実装済みなこと
- 申し訳程度の「さっき見たサイトをもう一度見る」リスト表示
- 某アメイゾンの商品ページ的なファイルパスにマルチバイト文字列が入ってる例のアレと rel=canonical による URL 正規化 (例のアレがグチャグチャにされても内部処理的には完全無視してるので問題無く対象ページにアクセス可能、動的なファイルパス訂正機能は必要なのかどうか)
- XML サイトマップ (sitemap.xml) の自動生成と各ページとの完全連動
- JSON-LD ならびに HTML (ol) 形式のパンくずリストの自動生成
- スクリプト内における自前の低負荷高速 HTTP 503 エラー処理
- 管理データ (検索対象となるテキストファイル) の編集管理の外部サイト化、リモート取得
現在の課題と今後実装したいこと
- スクリプト内で次のページへのリンクを押した瞬間から 10 数秒だか無応答になった挙句に接続がリセットされてしまって意味不明な件 (レン鯖の SSD がとか関係あったりしない?)
- 登録サイトの募集と登録ユーザ自身による登録サイト情報の編集機能 (現時点では不可で未定)
今後について
時間が空いて気が向いた際に追記致します (更新: 2026-01-08)