博客链接:https://blog.51cto.com/u_13637423
Microsoft 在今年的Ignite上推广了Syntex功能,可以利用AI服务自动读取、标记和处理存储在SharePoint中的文档内容,提供可靠的分析、安全性和自动保留来管理文档的生命周期。
Syntex 使用内容 AI 工具和服务优化内容生命周期的各个阶段,下图简要概述了 Syntex 在每个阶段的任务:
· 内容收集:可以帮助企业大规模生成可重复内容
· 内容处理:
o 可以帮助企业提取、标记和索引内容
o 识别图像中的对象和文本
o 在不影响原始文件的情况下批注文件
o 翻译和汇总文档
o Syntex 中的光学字符识别 (OCR) 服务使你可以从图像中提取印刷或手写文本
· 内容查询,通过基本的文档关键信息,进行搜索来帮助用户查找文档
· 工作流自动化,启程Power Automate实现其他业务的流程化管理
Microsoft Syntex中的内容理解始于文档处理模型。 使用文档处理模型可以识别上传到 SharePoint 文档库的文档并对其进行分类,然后从每个文件中提取所需的信息。Syntex使用自定义模型和预生成模型,目前已针对特定结构化文档进行训练的预生成文档处理模型包括:合同处理、发票处理和收据处理。
· 合同处理,协定处理模型从合同文档分析和提取关键信息。 API 以各种格式分析合同,并提取关键合同信息,例如客户或参与方名称、帐单地址、司法管辖区和到期日期。
· 发票处理,发票处理模型从销售发票中分析和提取关键信息。 API 以各种格式分析发票,并提取关键发票信息,例如客户名称、帐单邮寄地址、截止日期和应付金额。
· 收据处理,预生成收据处理模型分析和提取销售收据的关键信息。 API 分析打印的收据和手写收据,并提取关键收据信息,例如商家名称、商家电话号码、交易日期、税款和交易总额。
那么接下来将给大家介绍,如何使用Microsoft Syntext处理内容?
先决条件:
1. 在 Syntex 中使用预生成的文档处理之前,必须先链接 Syntex 即用即付中的 Azure 订阅。 Syntex 中的预生成文档处理根据 事务类型和数量计费
2. 具有全局管理员或 SharePoint 管理员权限才能访问 Microsoft 365 管理中心并在 Syntex 中设置预生成文档处理。
按照以下步骤管理用户可用于创建预生成模型以处理文件的 SharePoint 网站:
1. 在Microsoft 365 管理中心中,选择“设置”,然后选择“将内容 AI 与Microsoft Syntex配合使用”。
2. 在“将内容 AI 与Microsoft Syntex配合使用”页上,选择“管理Microsoft Syntex”。
3. 在“管理Microsoft Syntex”页上,选择“预生成文档处理”。
4. 在 “预生成的文档处理 ”页上,选择为哪个站点启用服务,点击保存
以发票模型为例,从Microsoft Syntex中的发票中提取信息的操作步骤如下:
1. 在模型库中,选择创建模型,选择发票处理,填写相关信息如下所示:
2. 在“模型 ”页上的“ 添加要分析的文件 ”部分中,选择“ 添加文件”。
3. 在“要分析模型的文件 ”页上,选择“ 添加 ”以查找要使用的文件。
4. 在“从训练文件库添加文件 ”页上,选择该文件,然后选择“ 添加”。
为模型选择提取器的操作步骤如下所示:
1. 在提取程序详细信息页上,你将在右侧看到文档区域和左侧的“提取程序 ”面板。 “ 提取程序 ”面板显示文档中已标识的提取程序列表。
2. 可以根据自己的偏好,从文档区域或“提取程序”面板中选择 提取程序 。
· 若要从文档区域选择提取器,请选择实体字段。
选择提取程序时,文档区域中会显示“选择提取程序?” 框。 该框显示提取程序名称、原始值,以及将其选择为提取程序的选项。 对于某些数据类型(如数字或日期),它还会显示提取的值。
3. 若要保存更改并返回到模型主页,请在“ 提取程序 ”面板中选择“ 保存并退出”。
4. 如果已准备好将模型应用于库,请在文档区域中选择“ 下一步”。 在 “添加到库 ”面板上,选择要添加模型的库,然后选择“ 添加”。
Microsoft Syntex 中的内容中心提供模型使用情况分析,以提供有关如何使用从内容中心发布的模型的详细信息。 内容中心的模型最近 30 天的运行情况部分包括以下图表和列表中提供的 30 天使用情况分析数据汇总:
下图为按模型分类的样例:
本文分享仅限于如何是Microsoft Syntex来自动识别文档内容进行分类,关于后续的生命周期管理,大家可以结合Retention Label尝试结合,若使用中有任何问题,欢迎线下讨论。