pikesaku’s blog

個人的な勉強メモです。記載内容について一切の責任は持ちません。

あいまい検索について

https://www.brains-tech.co.jp/neuron/blog/fuzzy-search/#:~:text=%E3%81%82%E3%81%84%E3%81%BE%E3%81%84%E6%A4%9C%E7%B4%A2%E3%81%A8%E3%81%AF%E3%80%81%E7%9F%AD%E6%96%87,%E3%81%A8%E3%81%97%E3%81%A6%E7%9F%A5%E3%82%89%E3%82%8C%E3%81%A6%E3%81%84%E3%81%BE%E3%81%99%E3%80%82

定義もあいまい

本来は
 部分一致(検索KW含む)
 前方一致(検索KWで始まる)
 後方一致(検索KWで終わる)

最近は
 表記ゆれ対応
  例)大文字小文字
  例)「データベース」「データーベース」
  例)「メガネ」「めがね」「眼鏡」
 OCR読込誤り、記載誤り対応
 自然文検索
  例)「スマフォで撮影した写真をプリントアウトする方法は?」
  →形態素解析でKW抽出し、各KWで検索

あいまい検索の補助機能

 類似する文書の最新版のみを表示する
 他の従業員からよく利用される文書の優先表示
 よく検索されるサジェストキーワードの表示
 管理者によるサジェストキーワードの登録機能

他参考
https://www.info-brdg.co.jp/savvy/savvy_engine.html