题量还是挺多的,要求1个小时手写写完,我是没写完…果然scir越来越卷了,希望scir收下我
原创 2021-11-30 10:02:02
680阅读
作者:哈工大SCIR 车万翔教授导读2020年5月23日,有幸受邀在中国中文信息学会青年工作委员会主办的AIS(ACL-IJCAI-SIGIR)2020顶会论文预讲会上介绍了ACL会议近年来的研究趋势,特整理成幻灯片配文字版,希望对相关领域的研究者有所帮助。由于视野所限,时间仓促,特别是ACL 2020的录用论文列表刚发布不久,因此统计的数据和得出的结论难免有失偏颇,如有不当之处,还敬请指出。另外
转载 2022-10-19 16:34:16
40阅读
自然语言处理面临着8个难点,即语言的抽象性、组合性、歧义性、进化性、非规范性、主观性、知识性及难移植性。正是由于这些难点的存在,导致自然语言处理任务纷繁复杂。不过,虽然自然语言处理任务多种多样,却可以被归为三大类常见的自然语言处理任务,即:语言模型、基础任务以及应用任务。本文就分别来介绍一下! 语言模型 语言模型(Language Model,LM)(也称统计语言模型)是描述自然语言概率分布的模型
1任务介绍及比赛结果在刚刚结束的CoNLL-2018国际评测(universaldependencies.org)中,哈工大社会计算与信息检索研究中心(HIT-SCIR)取得了第一名的好成绩。CoNLL系列评测每年由ACL的计算自然语言学习会议(ConferenceonComputationalNaturalLanguageLearning,CoNLL)主办,是自然语言处理领域影响力最大的国际技术
原创 2020-11-22 23:20:00
356阅读
作者:哈工大SCIR 覃立波、谢天宝等指导老师:哈工大SCIR 车万翔教授简介口语语言理解(Spoken Language Understanding,SLU)作为任务型对话系统的核心组件...
作者:忆臻 (哈工大SCIR实验室在读博士生)魏福煊 哈工大
转载 2022-11-14 15:59:35
157阅读
作者:哈工大SCIR 聂润泽1.摘要现今神经机器翻译系统已取得很好的
还在嫌弃pyltp安装失败吗https://github.com/HIT-SCIR/ltp快速上手快速安装安装LTP是非常简单的,使用Pip安装只需要
原创 2023-05-17 15:01:17
142阅读
2019-12-09 04:31:10作者 | 张宁(哈工大SCIR)编辑 | 唐里本文转载自公众号哈工大SCIR数据增强(Data Augmentation)是一种通过让有限的数据产生更多的等价数据来人工扩展训练数据集的技术。它是克服训练数据不足的有效手段,目前在深度学习的各个领域中应用广泛。但是由于生成的数据与真实数据之间的差异,也不可避免地带来了噪声问题。为什...
作者 冯夏冲学校 | 哈工大SCIR实验室在读博士生# -*- coding:utf-8 -*-import matplotlib as mplimport matplotlib.pyplot as pltimport numpy as np%matplotlib inline%config InlineBackend.figure_format = 'svg'plt.rcParams[
推荐哈工大的 https://github.com/HIT-SCIR/ltp 支持python / java / c++英文的话推荐https://github.com/explosion/spaCy 并继续关注spacy的中文版的开发情况https://github.com/howl-anderson/Chinese_models_for_SpaCy...
原创 2022-07-19 12:16:23
570阅读
机器学习算法与自然语言处理出品@公众号原创专栏作者 冯夏冲学校 | 哈工大SCIR实验室在读博士生# -*- coding:utf-8 -*-import matplotlib as mplimport matplotlib.pyplot as pltimport numpy as np%matplotlib inline%config InlineBackend.figure_form
导语:此项目使用LTP分词,python版本为python3.6,windows平台,使用whl文件进行安装。项目完整文件见人工智能——构建依存树——使用LTP分词 ltp_data文件中为ltp分词所需模型,由于Gitee大小限制,所以这里的模型需要手动下载http://model.scir.yu ...
转载 2021-07-11 23:04:00
802阅读
2评论
论文名称:Less Is More: Domain Adaptation with Lottery Ticket for Reading Comprehension论文作者:朱海潮,汪泽堃,张恒,刘铭,赵森栋,秦兵原创作者:朱海潮论文链接:https://aclanthology.org/2021.findings-emnlp.95/出处:哈工大SCIR1. 介绍机器阅读理解旨在根据给定上下文来回
论文名称:N-LTP: A Open-source Neural Chinese Language Technology Platform with Pretrained Models论文作者:车万翔,冯云龙,覃立波,刘挺原创作者:冯云龙论文链接:https://arxiv.org/abs/2009.11616转载须标注出处:哈工大SCIR背景现有种类繁多的自然语言处理(NLP)工具包,例如Cor
机器学习算法与自然语言处理出品@公众号原创专栏作者yyHaker单位 |哈工大SCIR实验室损失函数用来评价模型的预测值和真实值不一样的程度,损失函数越好,通常模型的性能越好。不同的模型用的损失函数一般也不一样。
如何将输入的文档转变为只含有关键信息的图谱?本文来自https://github.com/liuhuanyong/TextGrapher在运行程序前,请确保已安装pyltp,详细的pyltp安装教材请参考:https://github.com/HIT-SCIR/pyltp项目介绍如何用图谱和结构化的方式,即以简洁的方式对输入的文本内容进行最佳的语义表示是个难题。TextGrapher对这一问题进行
原创 2021-01-01 11:42:19
1234阅读
1点赞
在前不久落下帷幕的第十六届国际语义评测比赛(The 16th International Workshop on Semantic Evaluation, SemEval 2022)中,哈工大社会计算与信息检索研究中心(HIT-SCIR)与哈工大讯飞联合实验室的联合团队在多语种惯用语识别任务子赛道Subtask A(one-shot)中获得冠军。本期我们将对这个任务的夺冠系统进行简要介绍,更多具体
机器学习算法与自然语言处理出品@公众号原创专栏作者忆臻学校|哈尔滨工业大学SCIR实验室博士生在读目前ACL2020正在线上开会,本仓库整理了ACL2020中430篇有代码开源的所有论文,代码下载地址。效果如下:仓库地址:yizhen20133868/NLP-Conferences-Codegithub.com我们还整理了ACL2019,NAACL2019,EMNLP2019的开源代码希望对大家有
原创 2020-11-20 19:03:31
791阅读
论文名称:Inverse is Better! Fast and Accurate Prompt for Few-shot Slot Tagging论文作者:侯宇泰,陈成,罗先镇,李博涵,车万翔出处:哈工大SCIR1. 简介在本文中,我们探索了如何更好的将提示学习(Prompt)方法运用到小样本槽位标注任务上。基于Prompt的方法将目标任务转化为语言模型建模任务,减少了预训练任务和目标任务之间的
  • 1
  • 2