博客链接:https://blog.51cto.com/u_13637423

Microsoft 在今年的Ignite上推广了Syntex功能,可以利用AI服务自动读取、标记和处理存储在SharePoint中的文档内容,提供可靠的分析、安全性和自动保留来管理文档的生命周期。

Syntex 使用内容 AI 工具和服务优化内容生命周期的各个阶段,下图简要概述了 Syntex 在每个阶段的任务:

Microsoft 365 解决方案:浅谈Microsoft Syntex的应用以及如何使用Microsoft Syntext处理内容_API

·       内容收集:可以帮助企业大规模生成可重复内容

·       内容处理:

o   可以帮助企业提取、标记和索引内容

o   识别图像中的对象和文本

o   在不影响原始文件的情况下批注文件

o   翻译和汇总文档

o   Syntex 中的光学字符识别 (OCR) 服务使你可以从图像中提取印刷或手写文本

·       内容查询,通过基本的文档关键信息,进行搜索来帮助用户查找文档

·       工作流自动化,启程Power Automate实现其他业务的流程化管理

Microsoft Syntex中的内容理解始于文档处理模型。 使用文档处理模型可以识别上传到 SharePoint 文档库的文档并对其进行分类,然后从每个文件中提取所需的信息。Syntex使用自定义模型和预生成模型,目前已针对特定结构化文档进行训练的预生成文档处理模型包括:合同处理、发票处理和收据处理。

·       合同处理,协定处理模型从合同文档分析和提取关键信息。 API 以各种格式分析合同,并提取关键合同信息,例如客户或参与方名称、帐单地址、司法管辖区和到期日期。

·       发票处理,发票处理模型从销售发票中分析和提取关键信息。 API 以各种格式分析发票,并提取关键发票信息,例如客户名称、帐单邮寄地址、截止日期和应付金额。

·       收据处理,预生成收据处理模型分析和提取销售收据的关键信息。 API 分析打印的收据和手写收据,并提取关键收据信息,例如商家名称、商家电话号码、交易日期、税款和交易总额。

那么接下来将给大家介绍,如何使用Microsoft Syntext处理内容?

先决条件:

1.      在 Syntex 中使用预生成的文档处理之前,必须先链接 Syntex 即用即付中的 Azure 订阅。 Syntex 中的预生成文档处理根据 事务类型和数量计费

2.      具有全局管理员或 SharePoint 管理员权限才能访问 Microsoft 365 管理中心并在 Syntex 中设置预生成文档处理。

按照以下步骤管理用户可用于创建预生成模型以处理文件的 SharePoint 网站

1.      在Microsoft 365 管理中心中,选择“设置”,然后选择“将内容 AI 与Microsoft Syntex配合使用”。

2.      在“将内容 AI 与Microsoft Syntex配合使用”页上,选择“管理Microsoft Syntex”。

3.      在“管理Microsoft Syntex”页上,选择“预生成文档处理”。

4.      在 “预生成的文档处理 ”页上,选择为哪个站点启用服务,点击保存

以发票模型为例,从Microsoft Syntex中的发票中提取信息的操作步骤如下:

1.     在模型库中,选择创建模型,选择发票处理,填写相关信息如下所示:

Microsoft 365 解决方案:浅谈Microsoft Syntex的应用以及如何使用Microsoft Syntext处理内容_生成模型_02


2.      在“模型 ”页上的“ 添加要分析的文件 ”部分中,选择“ 添加文件”。

Microsoft 365 解决方案:浅谈Microsoft Syntex的应用以及如何使用Microsoft Syntext处理内容_文档处理_03

3.      在“要分析模型的文件 ”页上,选择“ 添加 ”以查找要使用的文件。

Microsoft 365 解决方案:浅谈Microsoft Syntex的应用以及如何使用Microsoft Syntext处理内容_生成模型_04

4.      在“从训练文件库添加文件 ”页上,选择该文件,然后选择“ 添加”。

为模型选择提取器的操作步骤如下所示:

1.      在提取程序详细信息页上,你将在右侧看到文档区域和左侧的“提取程序 ”面板。 “ 提取程序 ”面板显示文档中已标识的提取程序列表。

2.      可以根据自己的偏好,从文档区域或“提取程序”面板中选择 提取程序 。

·       若要从文档区域选择提取器,请选择实体字段。

Microsoft 365 解决方案:浅谈Microsoft Syntex的应用以及如何使用Microsoft Syntext处理内容_API_05

选择提取程序时,文档区域中会显示“选择提取程序?” 框。 该框显示提取程序名称、原始值,以及将其选择为提取程序的选项。 对于某些数据类型(如数字或日期),它还会显示提取的值。


3.      若要保存更改并返回到模型主页,请在“ 提取程序 ”面板中选择“ 保存并退出”。

4.      如果已准备好将模型应用于库,请在文档区域中选择“ 下一步”。 在 “添加到库 ”面板上,选择要添加模型的库,然后选择“ 添加”。

Microsoft Syntex 中的内容中心提供模型使用情况分析,以提供有关如何使用从内容中心发布的模型的详细信息。 内容中心的模型最近 30 天的运行情况部分包括以下图表和列表中提供的 30 天使用情况分析数据汇总:

下图为按模型分类的样例:

Microsoft 365 解决方案:浅谈Microsoft Syntex的应用以及如何使用Microsoft Syntext处理内容_生成模型_06

本文分享仅限于如何是Microsoft Syntex来自动识别文档内容进行分类,关于后续的生命周期管理,大家可以结合Retention Label尝试结合,若使用中有任何问题,欢迎线下讨论。