Excel 新增对话式智能分析功能

作为人们日常办公最重要的工具之一,Excel 功能强大而多样,但许多用户对 Excel 的使用停留在基础的表格制作与存储上,数据分析功能仍然具备一定的专业门槛。

基于数据智能领域丰富的研究成果,微软亚洲研究院开发了一个智能数据分析算法 AnnaParser,来提高 Excel 的智能数据分析能力。为了解决新表格实体识别的问题,AnnaParser 首先引入了一个数据抽象模块(data abstraction)来识别自然语言中与表格相关的部分,比如表名、列名、表格值,然后将这些词汇替换成相应的符号输入语义解析模块,使模型与表格不相关,提升了模型对不同表格的泛化能力。同时,为了实现领域知识的匹配,在实体识别阶段,AnnaParser 还引入了一个知识理解(knowledge understanding)模块,挖掘每个表格背后隐含的知识,表示成知识卡片(knowledge frame),提升实体识别的准确率。

在语义解析阶段,AnnaParser 将语义规则和深度学习算法结合起来,构建了一个自底向上(bottom-up)的解析框架来生成树形的逻辑表达。最后,将逻辑表达式转换为可执行的语言,例如 SQL 等。这个框架可以充分发挥语义逻辑的知识推理能力和深度神经网络的映射学习能力,拥有以下几个优点:首先,与传统的完全基于规则的方法相比,它具有良好的语言灵活性和泛化能力;其次,与端到端的神经网络模型相比,它具有良好的可解释性,容易进行系统调试和渐进调优,并且能够高效地利用通用知识和领域知识;再次,因为语义规则是语言无关的,而且深度神经网络无需进行复杂的特征工程,它具备良好的多语言扩展能力,大大降低了多语言支持的成本。

经过微软亚洲研究院与 Excel 团队的通力合作,AnnaParser 算法已经进入到 Excel 的“Ideas”预览版中。今后,你只要向 Excel 提出一个问题,Excel 就可以通过可视化图表的方式将智能数据分析结果呈现在你的眼前。AnnaParser 将让更多用户能够轻松、高效、零门槛地利用 Excel 进行数据分析,洞见各行各业数据中蕴藏的独特价值。

数据分析窗体 excel2019数据分析对话框在哪_多语言

图3:对话式数据分析已进入 Excel 中的 Ideas 预览版功能