医学AI又一突破，微软开源生物医学NLP基准：BLURB

关注 HyperAI超神经

医学AI又一突破，微软开源生物医学NLP基准：BLURB

原创

HyperAI超神经 2023-05-18 11:20:42 ©著作权

文章标签 数据集 Domain github 文章分类 Python 后端开发

©著作权归作者所有：来自51CTO博客作者HyperAI超神经的原创作品，请联系作者获取转载授权，否则将追究法律责任

By 超神经

内容概要：微软团队发布生物医学领域 NLP 基准，命名为 BLURB，已在 arxiv.org 中发布相关论文，并将其开源。

关键词：生物医学自然语言处理基准

微软的研究团队近日在 arxiv.org 发布了论文：《Domain-Specific Language Model Pretraining for Biomedical Natural Language Processing 生物医学特定领域的语言模型预训练》，介绍并开源了一个能够用于生物医学领域 NLP 基准，并命名为 BLURB。

医学AI又一突破，微软开源生物医学NLP基准：BLURB_Domain

论文地址：https://arxiv.org/pdf/2007.15779.pdf

Biomedical Language Understanding and Reasoning Benchmark 的首字母缩写，即为 BLURB 的命名规则，翻译为生物医学语言理解和推理基准。

医学 NLP 基准，BLURB 身负重任

BLURB 包括 13 个公开可用的数据集，涉及 6 个不同的任务。

为了避免偏重多可用数据集的任务，如命名实体识别（NER），BLURB 的报告和排名，将所有任务的宏观平均数作为主要得分。

医学AI又一突破，微软开源生物医学NLP基准：BLURB_数据集_02

图为 BLURB 中使用的数据集、以及

团队列出的训练、开发和测试中的实例数量

BLURB 排行榜是不分模型的。任何能够使用相同的训练和开发数据产生测试预测的系统都可以参与。

团队表示 BLURB 的主要目标是：降低生物医学NLP的准入门槛，帮助加快该领域的进展，能对社会和人类产生积极影响。

生物医学 NLP ：必须使用域内文本

研究已经表明生物医学 NLP 可以在医学领域提高数据集的准确性。但是在跨学科的数据集中，准确性又会大大降低。而由于不同医学领域之间（Domain）跨度较大，所以对于 NLP 的预训练会花费非常多的时间。

微软研究人员为了提升 NLP 的训练速度，通过对预训练和特定任务的微调，对生物医学 NLP 应用的影响进行了建模比较，从而评估最适合的预训练方法。

医学AI又一突破，微软开源生物医学NLP基准：BLURB_Domain_03

团队对域内文本与混合域外文本进行的对照

首先，团队创建了一个名为「生物医学语言理解与推理基准」（BLURB）的基准，该基准侧重于 PubMed 提供的出版物，涵盖了相似问题解答和文本提取之类的任务。

实验证明，这种对比的方法能够将 NLP 训练的速度提升数倍。

同时，为了鼓励对生物医学 NLP 的研究，研究人员创建了以 BLURB 基准为基准的排行榜，还开源了预训练模型。以求快速生物医学 NLP 能够早日投入使用。

访问 https://microsoft.github.io/BLURB/

—— 完 ——

医学AI又一突破，微软开源生物医学NLP基准：BLURB_数据集_04

赞
收藏
评论
分享
举报

上一篇：信息检索、路径规划、电子商务，KDD 的战场有哪些？

下一篇：《流浪地球 2》 Deepfake 小试牛刀，45+ 吴京「被」年轻，变身 21 岁小鲜肉

提问和评论都可以，用心的回复会被更多人看到评论

发布评论

相关文章

举报文章

请选择举报类型

内容侵权涉嫌营销内容抄袭违法信息其他

具体原因

包含不真实信息涉及个人隐私

原文链接（必填）

补充说明

0/200

上传截图

格式支持JPEG/PNG/JPG，图片不超过1.9M

已经收到您得举报信息，我们会尽快审核

鸿蒙开发者社区

WOT技术大会

公众号矩阵

移动端

短视频免费课程课程排行直播课软考学堂

全部课程厂商认证 IT技术 24年11月软考 PMP项目管理免费题库

在线学习

文章资源问答课堂专栏直播

51CTO

鸿蒙开发者社区

51CTO技术栈

51CTO官微

51CTO学堂

51CTO博客

CTO训练营

鸿蒙开发者社区订阅号

51CTO软考

51CTO学堂APP

51CTO学堂企业版APP

鸿蒙开发者社区视频号

51CTO软考题库

51CTO博客

首页
关注
排行榜
精品课程
免费资料
软考题库

科目全、试题精、讲解专业，扫码免费刷

搜索历史清空

热门搜索

查看【】的结果
写文章
创作中心
登录注册