SearchRecommend

介绍

搜索推荐样例

架构图

项目说明

tmdb 作为数据源，训练es的使用
搜索以及推荐部分

ES

ES是什么
1. 独立网络上一组进程节点。对外提供搜索服务。对内就是一个搜索数据库
名词定义
1. 索引 == 数据库
2. 类型 == 表（7.0以后取消）
3. 文档 == 行数据
索引。搜索中的数据库或表定义。构建文档时候的索引创建
分词。搜索是以词为单位做最基本的搜索单元，依靠分词器构建分词，用分词构建倒排索引。
TF-IDF打分。
1. TF。词频。这个document文档报了多少这个词，包含越多表明越相关
2. DF: 文档频率。包含该词的文档总数目
3. 词频归一化
分词器。字符过滤器（过滤特殊符号外加量词，the 等等） -> 字符处理 -> 分词过滤（分词转换，词干转化）

Tmdb项目中的es使用

索引建立
match查询
1. 按照字段上定义的分词分析后去索引内查询
2. match分词后的and和or。match 默认使用的是or。
3. 最小词项匹配
term查询，不进行词的分析，直接去索引查询，及搜索关键词和索引内词的精确匹配
短语查询，短语前缀词查询
多字段查询
1. 加权重的多字段
布尔查询
1. must：必须是true
2. must not :必须是false
3. should：其中有一个为true即可。为true越多则得分越高
不同类型查询
1. best_fields:默认的得分方式，取得分最高的作为对应的分数，最匹配模式,
2. most_fields:考虑绝大多数文档的字段得分相加，获得我们想要的结果
3. cross_fields:以分词为单位计算栏位总分
filter查询
1. 单条件过滤
2. 多条件过滤
3. 带match的filter
function 自定义打分
1. field：声明对应要处理的字段
2. modifier：计算对数
3. factor ：影响因子，预处理
4. score_mode：不同的field value之间的得分相加
5. boost_mode：最后在与old value相加
查全率查准率。两者不可兼得，寻求平衡。
1. 查全率：正确的结果有n个，查询出来正确的有m个
2. 查准率：查出的n个文档有m个准确
分词器
1. analyzer 指定的是构建索引的时候的分词
2. search_analyzer 指定的是搜索关键字时候的分词
3. 最佳实践：索引的时候用max_word，但是查询的时候用smart_word

es 搜索进阶

IK分词器定制化
1. 定制化。扩展词库。热更新词库。根据http请求的last-modifide 和etag，每1分钟检测一次。
2. 同义词及词性。语义相近或相同。品牌类目关联。
同义词及相关处理 2. 更改搜索条件以及方式
索引实时性
1. 使用logstash,第一次全量构建索引，然后每分钟执行sql，进行增量索引更新。
  1. 使用logstash-input-jdbc。
  2. 全量索引导入完成后，尝试使用时间戳维度做增量导入，即logstash-input-jdbc每隔一段时间执行某条sql，在对应sql内加入update-at的时间范围，做增量数据捞取后更新到es中
  3. 增量sql。同时需要新增一个文件用户记录档次执行的update_at时间。
2. canal 引入
  1. 接入canal client

后续迭代

构建用户画像

Name		Name	Last commit message	Last commit date
Latest commit History 5 Commits
recommend		recommend
search		search
.gitignore		.gitignore
LICENSE		LICENSE
README.en.md		README.en.md
README.md		README.md
structure.png		structure.png

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Repository files navigation

SearchRecommend

介绍

架构图

项目说明

ES

Tmdb项目中的es使用

es 搜索进阶

推荐系统

后续迭代

About

Releases

Packages

Languages

License

NewPracticer/SearchRecommend

Folders and files

Latest commit

History

Repository files navigation

SearchRecommend

介绍

架构图

项目说明

ES

Tmdb项目中的es使用

es 搜索进阶

推荐系统

后续迭代

About

Resources

License

Stars

Watchers

Forks

Releases

Packages 0

Languages

Packages