分类:
Azure搜索
◆
标签:
#Azure
#Search
#认知搜索
◆
发布于: 2023-06-12 20:52:38
知识存储是 Azure 认知搜索的一项功能,它可以将输出从AI扩充管道发送到 Azure 存储,供后续分析或进行下游处理。
扩充管道接受非结构化文本和图像内容,应用认知服务提供技术支持的 AI 处理,并输出之前不存在的新结构和信息。 管道创建的物理数据结构之一是Azure Storage,可以通过连接到Azure storage的任何工具、应用或进程访问它。
在本快速入门中,我们需要先设置数据,然后运行import data向导来创建一个同样会生成知识存储的扩充管道。 知识存储将包含从源提取的原始文本内容,以及 AI 生成的内容,包括情绪标签、关键短语提取和非英语客户评论的文本翻译。
Read more
分类:
Azure搜索
◆
标签:
#Azure
#Search
#认知搜索
◆
发布于: 2023-06-12 20:43:17
本快速入门演示了Portal中的AI技能组合支持,介绍如何使用光学字符识别(OCR)和实体识别从图像和应用程序文件创建可搜索的文本内容。
我们预先要创建几个资源,并上传示例图像和应用程序内容文件。 一切准备就绪后,可在 Azure 门户中运行import data向导,以将这些数据提取到一起。 最终结果是一个可在门户(搜索资源管理器)中查询的可搜索索引,其中填充了 AI 处理功能创建的数据。
开始之前,必须具备以下先决条件:
具有活动订阅的 Azure 帐户。
Azure 认知搜索服务。 创建服务或在当前订阅下查找现有服务。 可以使用本快速入门的免费服务。
具有 Blob 存储的 Azure 存储帐户。
Read more
分类:
Azure搜索
◆
标签:
#Azure
#Search
#认知搜索
◆
发布于: 2023-06-12 20:33:05
使用 Azure 门户的Create Demo App向导生成可在浏览器中运行、可供下载的localhost样式 Web 应用。 根据其配置,生成的应用在首次使用时就能正常运行,并与远程索引建立实时只读连接。 默认应用可以包含搜索栏、结果区域、边栏筛选器和自动提示支持。
该Demo App有助于你直观地了解索引在客户端应用中的工作方式,但其不适合生产场景。 客户端应用应包括生成的 HTML页面,且未提供安全保证、错误处理和托管逻辑。
在开始之前,必须满足以下条件:
具有活动订阅的 Azure 帐户。 免费创建帐户。
Azure 认知搜索服务。 创建服务或在当前订阅下查找现有服务。 可以使用本快速入门的免费服务。
Microsoft Edge(最新版本)或 Google
Read more
分类:
Azure搜索
◆
标签:
#Azure
#Search
#认知搜索
◆
发布于: 2023-06-12 20:28:47
本教程使用Azure Portal提供的数据导入功能以及示例酒店的数据给大家演示如何通过Azure Portal创建认知索引,以及演示如何进行简单的查询,也可以向大家演示认知搜索的基本概念。
在开始本教程之前,首先需要:
您需要拥有一个Azure的账号,您可以申请一个免费的。
创建一个Azureren认知服务
检查您的定价层
很多客户开始使用免费服务。 免费层限制为三个索引、三个数据源和三个索引器。 在开始之前,请确保有空间存储额外的项目。 本教程会创建每个对象的一个实例。
请查看服务概述页,以了解你已有多少索引、索引器和数据源。
Read more
分类:
Azure搜索
◆
标签:
#Azure
#Search
#认知搜索
◆
发布于: 2023-06-12 20:18:07
在Azure 认知搜索中,AI扩充是指内置认知技能和自定义技能,用于在索引编制过程中添加内容转换和生成。 扩充创建以前不存在的新信息:
从图像中提取信息
从文本中检测情感
关键短语和实体
AI扩展还向无差别文本中添加结构。 所有这些过程将产生使全文搜索更有效的文档。 在许多情况下,AI扩展的文档可用于除搜索以外的方案,例如知识挖掘。
AI扩展由附加到索引器的技能组定义。 索引器将提取内容并进行设置,而技能组从图像、Blob 和其他非结构化数据源中识别、分析和创建新信息和结构。 AI扩展管道的输出是搜索索引或知识存储(Storage)。
Read more
分类:
Azure搜索
◆
标签:
#Azure
#Search
#认知搜索
◆
发布于: 2023-06-12 20:14:18
Azure认知搜索中的索引器是一种爬虫程序,它从外部 Azure 数据源提取可搜索的文本和元数据,并使用源数据与索引之间字段到字段的映射填充搜索索引。 由于不需要编写任何将数据添加到索引的代码,该服务就能拉取数据,因此这种方法有时也称为拉取模式。 索引器还驱动认知搜索的 AI 扩充功能,在索引的路由中集成对内容的外部处理。
索引器仅适用于 Azure,其中包含适用于 Azure SQL、Azure Cosmos DB、Azure 表存储 和 Blob 存储的单个索引器。 配置索引器时,将指定数据源(原点)和索引(目标)。 Blob 存储等源具有特定于该内容类型的其他配置属性。
可以按需运行索引器,也可以采用每 5 分钟运行一次的定期数据刷新计划来运行索引器。 要进行更频繁的更新,
Read more
分类:
Azure搜索
◆
标签:
#Azure
#Search
#认知搜索
◆
发布于: 2023-06-12 20:11:31
微软的文档永远都是言简意赅,博大精深,如果不认真不仔细看,经常就会有很多非常重要的提示或者技巧一晃而过,所以微软的文档是需要认真仔细的多读几遍才能够彻底的掌握清楚。
我们今天来学习相似性和评分。
开始之前我们回忆和熟悉几个名词:
SearchModel: 搜索模式,这个之前已经有介绍了,使用这个参数表示在搜索的时候部分匹配搜索词还是全部匹配搜索词(值:any,full)
字词频率:是指某个词在被搜索的文章中出现的频率(次数)
逆向文档频率:是一个词普遍重要性的度量值,它的大小和一个词的常见程度成反比。
Read more
分类:
Azure搜索
◆
标签:
#Azure
#Search
#认知搜索
◆
发布于: 2023-06-12 20:09:18
需要注意的是目前语义搜索功能通过public preview的形式提供给用户,因此如果用户如果想开通这项服务,必须通过特定的步骤:
检查区域支持和定价层的要求
注册preview program, 一般情况下需要两个工作日来处理。
创建和修改查询以返回语义描述和重点的内容。
调用拼写检查,最大限度的提高精准率和召回率。
语义搜索是用于提高搜索结果质量的功能集合。当启用该服务时,它通过两种方式来扩展查询:
在初始结果集的基础上添加二次排名,将和语义最接近的结果提升到列表顶部。
提取并返回相应结果中的描述和答案,可以供用户在页面上呈现,提升用户体验。
Read more
分类:
Azure搜索
◆
标签:
#Azure
#Search
#认知搜索
◆
发布于: 2023-06-12 20:06:52
分析器是全文搜索的重要概念,它既可以用于生成索引,也可以用于分析用户输入的查询词,经过转换或者分解之后对新的查询词进行标记,并返回查询树,主要可能会有如下的操作:
删除非必须字和标点。
将短语和用连字符链接的词语拆分为组成部分
将大写单词转换为小写单词
将单词分解为词根用以提高存储效率,方便找到匹配项。
在使用C#的SDK的时候,分析器适用于被标记为"可搜索"的字段属性上,表示全文搜索。
Read more
分类:
Azure搜索
◆
标签:
#Azure
#Search
#认知搜索
◆
发布于: 2023-06-12 20:04:55
Azure认知搜索底层集成了Lucene, 同时微软也提供了自己的技术,但是总体来说很多方面都还是用了Lucene, 因此Azure认知搜索同样遵行Lucene的四个阶段:查询分析, 词法分析, 文档匹配, 搜索结果评分。
本章只是简单的介绍一下Lucene的搜索的基本知识,方便大家在使用Azure认知搜索时遇到问题,会有比较明确的方向。
我们先来看几个基本的概念:
查询词:查询词是指客户输入的需要查询的语句,需要注意的是,即便是简单的查询词,也可能会被分解并重排。
搜索词:从查询词中提取的词语。
匹配词: 我的理解是同搜索词。
相关性评分:是指搜索引擎通过索引匹配之后,根据相关性对结果的打分,评分靠前的会返回给调用者。
我们前面说过了查询执行时包括四个阶段:
Read more