ElasticSearch推荐系统最佳实践资料包(腾讯实践版)

推荐系统代码说明文档.docx

目录:
推荐系统代码说明文档
修改数据库配置
修改链接数据库的ip和用户名密码:
修改链接到数据库的端口号:
修改Elasticsearch倒排索引配置
修改链接ES的IP和端口:
修改下面ES的IP和端口PORT配置
Crontab目录以及Crontab的运作机制和原理
从数据库里面的用户日志计算用户画像
根据用户画像选择文档,塞入候选词索引
分析用户点击日志,记录到数据库中(5分钟运行一次)
用户画像记录机制
用户搜索点击日志收集机制
用户交互日志定时5分钟周期刷新的到数据库
代码目录结构
代码模块运作机制
recommendation_search_keywords/ data_categorys模块
recommendation_search_keywords/ data_keywords模块
recommendation_search_keywords/ data_tags模块
search_server模块

Elasticsearch搜索应用实践(搭建篇).pdf

Elasticsearch(ES)是一个分布式搜索和分析引擎 ,它能为我们提供全文搜索等各种丰富的功能,You know, for search (and analysis)。内网中关于Elasticsearch大多都是调优分享、分布式相关,关于基础的文档基本是简单介绍,本文是从用研中的文档搜索实践出发介绍如何搭建一个全文搜索平台。 本文不做ES的介绍,因此看文章需要了解ES相关基础知识。

目录:
1、前言
2、搭建步骤
3、准备数据
4、数据结构
5、ES数据索引
6、数据同步
7、搜索DSL
8、丰富搜索功能
9、总结

Elasticsearch搜索Query理解.pdf

Query理解(QU,Query Understanding),简单来说就是从词法、句法、语义三个层面对query进行结构化解析。这里query从广义上来说涉及的任务比较多,最常见的就是我们在搜索系统中输入的查询词,也可以是FAQ问答或阅读理解中的问句,又或者可以是人机对话中用户的聊天输入。本文主要介绍在搜索中的query理解,会相对系统性地介绍query理解中各个重要模块以及它们之间如何work起来共同为搜索召回及排序模块服务,同时简单总结个人目前了解到业界在各个模块中的一些实现方法。

目录:
1、前言
2、相关概念
2.1 NLP
2.2 搜索引擎
2.2.1 离线挖掘
2.2.2 在线检索
2.2.3 多模语义搜索
3、Query理解
3.1 Pipeline流程
3.2 Query预处理
3.3 Query分词
3.3.1 分词技术
3.3.2 新词发现
3.4 紧密度分析
3.5 Term重要性分析
3.6 搜索引导
3.6.1 Query改写
3.6.1.1 Query纠错
3.6.1.2 Query扩展
3.6.1.3 Qyery归一
3.6.2 搜索联想词
3.7 意图识别
3.7.1 精准意图
3.7.2 模糊意图
3.7.2.1 意图分类
3.7.2.2 槽位解析
3.8 敏感识别
3.9 时效性分析
4、结语
5、参考文献

ElasticSearch搜索应用实践(排名优化篇).pdf

ElasticSearch (ES)是一个分布式搜索和分析引擎,它能为我们提供全文搜索等各种丰富的功能,You know, for search (and analysis)。内网中关于ElasticSearch大多都是分布式、性能调优等分享,关于基础的文档基本是简单介绍,同系列上一篇介绍了搭建实践本文从用研云中的文档搜索实践出发介绍如何优化ES搜索平台的结果排名。本篇文章需要一些ES基础知识和搜索领域基础知识。

目录:
1、前言
2、优化ES Query DSL
2.1 最初使用的multi_match
2.2 使用bool查询的filter增加筛选
2.3 使用match_phrase提高搜索短语的权重
2.4 使用gboost调整查询语句的权重
2.5 使用fuction_score增加更多的评分因素
2.6 最终结果
3、 再进一步,优化相关性算法
4、优化的建议
5、使用_explain做bad case分析
6、总结

下载地址:(链接失效请联系微信:buyuegg)

[vk-content]链接: https://pan.baidu.com/s/1KqUAFToIQ7EzmqserPDFGw 提取码: pn99 [/vk-content]

(0)
上一篇 2021年7月2日 上午10:42
下一篇 2021年7月5日 上午11:53

发表回复

登录后才能评论