1台のPCで作業が可能なビッグデータ内高速検索エンジン
eSearchEngine(イーサーチエンジン)
eSearchEngine(イーサーチエンジン)は検索対象として辞書ファイル(CSV形式)の各カラムを対象とし検索対象のファイル(CSV or Excel形式)とマッチングを行い、その結果と残りデータ(不成立データ)をExcel形式のファイルに出力することを目的とします。
ソフトウエアの構成
任意のクライアントマシンにインストールし、そのマシン単体で実行できます。
eSearchEngine(イーサーチエンジン)
PC内のファイルにキーボードから手入力した検索ワードが存在するか高速検索を行います。
使用対象者
名称コードやその名称を正確に知らない場合、検索者によってマッチングできないことがあります。
例えば、正式名称「オレンジジュース(果汁100%)」という品名を検索したい場合、検索者が正式名称を知らない場合、マッチングできるまでいろんな名称を手動でチャレンジし続けることになります。
eSearchEngine(イーサーチエンジン)は、部分一致を含めた高速検索を行います。
正式名「オレンジジュース(果汁100%)」を検索したい場合
検索名 | 通常の検索の マッチング |
eSearchEngineの マッチング |
オレンジジュース(果汁100%) | 〇 | 〇 |
オレンジジュース | × | 〇 |
ジュース | × | 〇 |
オレンジ | × | 〇 |
果汁100% | × | 〇 |
機能詳細
1.マッチング機能
完全一致、部分一致、単語分割の指定などの様々なマッチング機能を各カラム、または全カラムに対して行います。
マッチング検索はAND検索で行いますので、複数個の文字列を用いての絞り込み検索が可能です。
2.単語分割
ある程度の長さの検索ワードを入力した場合、マッチしない可能性がありますが、eSearchEngine(イーサーチエンジン)は入力した長文を一定の法則で単語分割して検索ワードを自動で区切れます。
例えば、検索ワードとして「東京都墨田区押上(スカイツリー)」とスペースを入れずに入力した場合、単語分割を行うと「東京 都墨田 区押上 スカイ ツリー」と5個の単語に分割されますので、この中の有効な文字列を使用して検索を行えます。
3.高速検索機能
eSearchEngine(イーサーチエンジン)は高速でマッチング処理を行います。
約100万件の辞書データと検索ファイル1件とマッチングを行った場合、通常の総当たり検索を行うと約10秒かかりますが、eSearchEngine(イーサーチエンジン)を使用すると1秒未満(240ミリ秒)でマッチングが行えます。
eSearchEngine(イーマッチエンジン)は初回の辞書データの読み込み時にインデックスファイルを作成します。搭載メモリ16.0GBのPCで実行すると約6分かかりますが、2度目以降はインデックスの作成は不要です。
4.結果ファイルの出力
マッチングデータと非マッチングデータを1つのexcelファイルにシート毎にまとめて出力します。
システム分類と動作条件
プログラム名 | 対応OSと搭載メモリ | 機能 |
eSearchEngine | WindowsOS
(7以降, 64bit) *4GB以上 |
辞書ファイルの読み込み
辞書ファイルのインデックスの作成 ファイルの読み込み 高速検索処理 |
* 使用データのサイズにも依存します。
事業再構築補助金により作成