首页 >> 大全

01

2023-12-20 大全 24 作者:考证青年

01--简介:

是一个基于的搜索服务器。它提供了一个分布式多用户能力的全文搜索引擎,基于 web接口。是用Java语言开发的,并作为许可条款下的开放源码发布,是一种流行的企业级搜索引擎。用于云计算,能够达到实时搜索,稳定,可靠,快速,安装使用方便。官方客户端在Java、.NET(C#)、PHP、、 、Ruby和许多其他语言中都是可用的。根据DB-的排名显示,是最受欢迎的企业搜索引擎,其次是 Solr,也是基于。

数据的结构分类:

1、结构化数据,表,mysql,方便管理和查询

2、非结构化数据,视频,服务器日志,报表等,redis等

3、半结构化数据,将数据的结构和内容混在一起。如果xml,json等

es处理实时数据的处理。

是什么

The Stack, 包括 、、Beats 和 (也称为 ELK Stack)。 能够安全可靠地获取任何来源、任何格式的数据,然后实时地对数据进行搜索、分析和可视 化。,简称为 ES,ES 是一个**开源的高扩展的分布式全文搜索引擎,**是整个 Stack 技术栈的核心。它可以近乎实时的存储、检索数据;本身扩展性很好,可以扩展到上百台服务器,处理 PB 级别的数据。

And Solr ,了解

是 软件基金会 项目组的一个子项目,提供了一个简单却强大的

应用程式接口,能够做全文索引和搜寻。在 Java 开发环境里 是一个成熟的免费开源

工具。就其本身而言, 是当前以及最近几年最受欢迎的免费 Java 信息检索程序库。

但 只是一个提供全文搜索功能类库的核心工具包,而真正使用它还需要一个完善的

服务框架搭建起来进行应用。

目前市面上流行的搜索引擎软件,主流的就两款: 和 Solr,这两款都是基

于 搭建的,可以独立部署启动的搜索引擎服务软件。由于内核相同,所以两者除了

服务器安装、部署、管理、集群以外,对于数据的操作 修改、添加、保存、查询等等都十

分类似。

在使用过程中,一般都会将 和 Solr 这两个软件对比,然后进行选型。这两

个搜索引擎都是流行的,先进的的开源搜索引擎。它们都是围绕核心底层搜索库 -

构建的 - 但它们又是不同的。像所有东西一样,每个都有其优点和缺点:

应用案例 (了解)

*** 2013 年初,抛弃了 Solr,采取 来做 PB 级的搜索。“ 使用 搜索 20TB 的数据,包括 13 亿文件和 1300 亿行代码”。

维基百科:启动以 为基础的核心搜索架构

:“ 使用 为 1.8 亿用户提供即时而精准的音乐搜索

服务”。

百度:目前广泛使用 作为文本数据分析,采集百度所有服务器上的各类指

标数据及用户自定义数据,通过对各种数据进行多维分析展示,辅助定位分析实例异常

或业务层面异常。目前覆盖百度内部 20 多个业务线(包括云分析、网盟、预测、文库、

直达号、钱包、风控等),单集群最大 100 台机器,200 个 ES 节点,每天导入 30TB+

数据。

新浪:使用 分析处理 32 亿条实时日志。

阿里:使用 构建日志采集和分析体系。

Stack :解决 Bug 问题的网站,全英文,编程人员交流的网站。

安装

1 下载软件

的官方地址:

最新的版本是 7.11.2(截止 2021.3.10),我们选择 7.8.0 版本(最新版本半

年前的版本)

下载地址:#

分为 Linux 和 版本,基于我们主要学习的是 的 Java

客户端的使用,所以课程中使用的是安装较为简便的 版本。

2.1.2 安装软件

版的 的安装很简单,解压即安装完毕,解压后的 的

目录结构如下

解压后,进入 bin 文件目录,点击 .bat 文件启动 ES 服务

注意:9300 端口为 集群间组件的通信端口,9200 端口为浏览器访问的 http

协议 端口。

打开浏览器(推荐使用谷歌浏览器),输入地址::9200,测试结果

2.1.3 问题解决

是使用 java 开发的,且 7.8 版本的 ES 需要 JDK 版本 1.8 以上,默认安装

包带有 jdk 环境,如果系统配置 ,那么使用系统默认的 JDK,如果没有配

置使用自带的 JDK,一般建议使用系统配置的 JDK。

双击启动窗口闪退,通过路径访问追踪错误,如果是“空间不足”,请修改

/jvm. 配置文件

# 设置 JVM 初始内存为 1G。此值可以设置与-Xmx 相同,以避免每次垃圾回收完成后 JVM 重新分配内存

# Xms the size of total heap space

# 设置 JVM 最大可用内存为 1G

# Xmx the size of total heap space

-Xms1g

-Xmx1g

基本操作

1

REST 指的是一组架构约束条件和原则。满足这些约束条件和原则的应用程序或设计就

是 。Web 应用程序最重要的 REST 原则是,客户端和服务器之间的交互在请求之

间是无状态的。从客户端到服务器的每个请求都必须包含理解请求所必需的信息。如果服务

器在请求之间的任何时间点重启,客户端不会得到通知。此外,无状态请求可以由任何可用

服务器回答,这十分适合云计算之类的环境。客户端可以缓存数据以改进性能。 在服务器端,应用程序状态和功能可以分为各种资源。资源是一个有趣的概念实体,它向客户端公开。资源的例子有:应用程序对象、数据库记录、算法等等。每个资源都使用 URI ( ) 得到一个唯一的地址。所有资源都共享统一的接口,以便在客 户端和服务器之间传输状态。使用的是标准的 HTTP 方法,比如 GET、PUT、POST 和

。 在 REST 样式的 Web 服务中,每个资源都有一个地址。资源本身都是方法调用的目 标,方法列表对所有资源都是一样的。这些方法都是标准方法,包括 HTTP GET、POST、 PUT、,还可能包括 HEAD 和 。简单的理解就是,如果想要访问互联 网上的资源,就必须向资源所在的服务器发出请求,请求体中必须包含资源的网络路径,以 及对资源进行的操作(增删改查)。

的安装和使用。基础操作。不做说明

数据格式

是面向文档型数据库,一条数据在这里就是一个文档。为了方便大家理解,

我们将 里存储文档数据和关系型数据库 MySQL 存储数据的概念进行一个类比

ES 里的 Index 可以看做一个库,而 Types 相当于表, 则相当于表的行。

这里 Types 的概念已经被逐渐弱化, 6.X 中,一个 index 下已经只能包含一个

type, 7.X 中, Type 的概念已经被删除了。

正向索引。根据索引快速定位。模糊查询或者全文查询,如何匹配。通过主键id关联文档。

id

======================

1001 my name is

1002 my name is lisi

倒排索引,通过关键字查询id,在通过id查询文档

可以word id

=======================

name 1001,1002

zhang 1001

id

======================

1001 my name is

1002 my name is lisi

倒排索引,通过关键字查询id,在通过id查询文档

可以word id

=======================

name 1001,1002

zhang 1001

参考来自:

关于我们

最火推荐

小编推荐

联系我们


版权声明:本站内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌抄袭侵权/违法违规的内容, 请发送邮件至 88@qq.com 举报,一经查实,本站将立刻删除。备案号:桂ICP备2021009421号
Powered By Z-BlogPHP.
复制成功
微信号:
我知道了