热门 最新 精选 话题 上榜
第二周 自然语言处理与词嵌入(Natural Language Processing and Word Embeddings)词汇表征(Word Representation)上周我们学习了 RNN、GRU 单元和 LSTM 单元。本周你会看到我们如何把这些知识用到 NLP 上,用于自然语言处理,深度学习已经给这一领域带来了革命性的变革。其中一个很关键的概念就是词嵌入(word embedding
©作者 | 高超尘单位 | 中国科学院信息工程研究所论文标题:ESimCSE: Enhanced Sample Building Method for Contrastive Learning of Unsupervised Sentence Embedding论文链接:https://arxiv.org/pdf/2109.04380.pdf代码链接:https://github.com/cask
go-cqhttp的下载与安装进入go-cqhttp的官网https://docs.go-cqhttp.org/下载对应的安装包然后双击安装包运行之后会生成一个config.yml配置文件在这个配置文件里,按照注释填写你的相关信息这里要注意,扫码登录要求登陆设备和手机在同一网络下。另外,要关闭QQ的设备锁。否则可能导致登录失败。然后解掉108、109行的注释图中信息不用修改,secret不用填写。
本文分享自华为云社区《华为开发者空间携手乐知行:轻松实现智能网联小车数据可视化系》,作者:华为开发者空间小助手。在AI重塑课堂、算力驱动教学创新的今天,让前沿技术从“概念”落地为“可感知的教学工具”,让师生在实操中触摸到数字世界的底层逻辑,成为突破教育发展瓶颈的关键。乐知行是一家为高校和企事业单位提供智能网联教学解决方案的科技型企业,已服务百余所高校。华为开发者空间与乐知行此次达成合作,依托华为开
T1问题背景 从前。 有个渔人有着一流的捕鱼技术,被人们尊称为”渔王”。然而”渔王”年老的时候非常苦恼,因为他的三个儿子的渔技都很平庸。 于是个经常向人诉说心中的苦恼:”我真不明白,我捕鱼的技术这么好,我的儿子们为什么这么差?我从他们懂事起就传授捕鱼技术给他们,从最基本的东西教起,告诉他们怎样织网最容易捕捉到鱼,怎样划船最不会惊动鱼,怎样下网最容易请鱼入瓮。他们长大了,我又教他们怎样识潮汐,辨鱼汛
书接上回,上一章我们已经使用 Unsloth 对 Qwen3-0.6B 模型进行了自动化微调工作。考虑到算力不足的情况,必须将微调后的模型进行量化后使用。为了方便后续工作的开展,在微调的最后环节我们已经将 LoRA 权重合并到基础模型中,合并后文件如下图所示:(base) yuanzhenhui@MacBook-Pro FinalBestModelMerged % ls added_tokens.
一 判断语句1.1 判断语句介绍什么是判断?如果某些条件满足,才能做某件事情;条件不满足时,则不能做,这就是所谓的判断。不仅生活中有,在软件开发中"判断"功能也经常会用到生活中的判断: 例如去网吧(判断是否成年) 银行取钱(判断密码是否正确)1.2 if语句if语句是用来进行判断的,其使用格式如下:if 要判断的条件: 条件成立时,要做的事情例如:满足条件时:不满足条件时:总结以上
Apache的三种工作模式1、prefork 工作模式(作用:用一个进程处理一个用户请求)2、worker 工作模式(作用:一个进程生成多个线程,一个线程处理一个用户请求)3、event 工作模式(用一个线程处理一个用户请求)apache基本信息主配置目录:/etc/httpd/conf主配置文件:/etc/httpd/conf/http.conf子配置目录:/etc/httpd/conf.d子配
20天前
358阅读
一、主题模型基础相关分布Beta分布:Beta分布期望求解共轭先验分布Dirichlet分布:Dirichlet分布的期望对称Dirichlet分布二、LDA模型LDA模型解释样例图LDA解释:共有m篇文章,一共涉及了K个主题;每篇文章(长度为N m )都有各自的主题分布,主题分布是多项分布,该多项分布的参数服从Dirichlet分布,该Dirichlet分布的参数为α;每个主题都有各自的词分布,
  词形还原(Lemmatization)是文本预处理中的重要部分,与词干提取(stemming)很相似。   简单说来,词形还原就是去掉单词的词缀,提取单词的主干部分,通常提取后的单词会是字典中的单词,不同于词干提取(stemming),提取后的单词不一定会出现在单词中。比如,单词“cars”词形还原后的单词为“car”,单词“ate”词形还原后的单词为“eat”。   在Python的nltk
本次介绍假新闻赛道一第一名的构建思路,大家一起学习下任务描述 文本是新闻信息的主要载体,对新闻文本的研究有助于虚假新闻的有效识别。虚假新闻文本检测,具体任务为:给定一个新闻事件的文本,判定该事件属于真实新闻还是虚假新闻。该任务可抽象为NLP领域的文本分类任务,根据新闻文本内容,判定该新闻是真新闻还是假新闻。针对该任务,本文采用BERT-Finetune、BERT-CNN-Pooling、
各位技术圈的朋友们,大家好! 提到“审计”,你脑海里浮现的是什么?是不是一群戴着眼镜的会计师,埋首在堆积如山的凭证和报表里,用计算器和荧光笔,进行着一场枯燥又漫长的“大家来找茬”游戏? 没错,这就是传统审计的画像:劳动密集、效率低下、高度依赖人工,而且往往是事后诸葛亮,等问题发生了才去补救。在数据量爆炸的今天,这种“大海捞针”式的审计方式,早已力不从心。 今天,我想和大家聊的,正是要颠覆这一切的“
第一章 梦想启航第1节 让计算机开口说话1、基础知识1)计算机“说话”的两种方式显示在屏幕上 通过喇叭发出声音 2)计算机“说话”之显示在屏幕上格式:printf("");注意:printf要加“f” printf后要加括号() 双引号""内是要计算机“说的内容” 所有符号全在英文符号环境下输入 分号;表示语句的结束 3)语言框架框架:#include<stdio.h> #includ
在人工智能技术飞速发展的今天,许多企业,尤其是中小企业,面临着“​​望 AI 兴叹​​”的困境:技术门槛高、人才储备不足、投入成本大。AI 产业服务平台应运而生,正成为破解这一困境的关键钥匙。 什么是 AI 产业服务平台? 简单来说,AI 产业服务平台是连接 AI 技术供给方和产业需求方的“​​智能中间件​​”。它通过整合技术、数据、算力和人才等要素,为企业提供一站式、低门槛的 AI 赋能服务。
BTM的原理跟LDA很像,下面是该模型的概率图:由该图可以看出来,与LDA的区别在于确定主题分布和词分布后相应地取两个词(而LDA只取一个,即类比常见的骰子说法:先投掷K面的骰子得到主题z,再根据相应的V面骰子,连续投掷两次,得到一对词汇),这俩词叫做biterm(就是在把一个文档分词之后,对这些词的设置一个距离指标,从第I个到第j个词之间两两结对,都可以看作一对biterm).从原文档得到bit
做技术的你,是不是也有过这样的无奈?运营半夜发消息:“活动文案要加 5 个版本,明早就要上线”;投放同事追着问:“用户画像跑偏了,能不能重新调接口?”;数据同学抱着 Excel 叹气:“营销效果报表算到凌晨,还怕算错”—— 传统营销就像 “没装自动化的生产线”,技术人成了 “临时搬运工”,而营销智能体 AI 赋能平台,本质是给这条生产线装 “智能流水线”,让你少做重复活,多聚焦核心技术。 先搞清
原创 22天前
79阅读
营销智能体 AI 平台:技术人告别营销需求返工的实战手册
寻找未来AI时代的机会和突破口
概念用户画像,是对用户特征的分析,是用户相关信息的可视化直观展现,是根据用户属性、偏好、习惯、行为等信息抽象出来的标签化的用户模型。通俗地讲就是给用户打标签,标签是通过用户信息分析得出的高精度的特征标识,方便计算机处理。用户特征分析模型举例:商品画像,是对商品特征的分析,商品画像如同用户画像一样,可以简单理解成是商品海量数据的标签,根据商品的特征、设计、功能、口味、波次、价位段、流行度、销售状况、
由于Windows Phone在考虑性能的情况下限制每个TextBlock最多显示高度为2000像素的文本,若超过此值,将自动被截断,显示空白。网上有很多此问题的解决方案,如:计算文字像素,向容器添加多个TextBlock。但此方法效率相对较低且可能导致文本分段不正确。据我所知常使用的方案有两种:1.分页,监听ScrollViewer,当滚动到最下方,自动加载新页内容(类似瀑布流)2.使用WebB
lucene中重要的类:    IndexWriter:lucene中最重要的类之一,主要用于索引的创建    Analyzer(抽象类):分析器,主要用于分析文本,常用的有StandardAnalyzer分析器,StopAnalyzer分析器,WhitespaceAnalyzer分析器等  &nb
22天前
398阅读
前言最近的项目nodejs+wcf+app,app直接从wcf服务获取数据,nodejs作为单独的服务器为app提供图形服务和聊天室功能。主要架构如下这一篇主要讲的是如何用nodejs+socketio实现一个基础的聊天室。其实这也是我第一个nodejs项目,真个知识体系还不太完整,遇到问题就度娘,有说错的地方请大家指正。聊天室功能点概要1.在线和离线人员管理2.消息的发送,广播以及离线消息3.音
做心理测评相关的技术同学,大概率听过机构的吐槽:纸质档案堆了半间屋,找一份3年前的青少年测评表,得翻遍5个文件柜;电子档用Excel存,量表分要手动算,常模对比靠查表,一套测评分析下来要2小时;更头疼的是,新人上手慢,解读结果总怕漏了关键指标——这些“低效又易错”的问题,正是AI心理测评档案管理系统要解决的。 它不是简单把纸质档案搬上网,而是给心理测评的“档案管理+结果分析”装了个“智能助手”,
医学院和体检机构的教学负责人大概都有过这样的困扰:一批20个学生学心肺听诊,只有1个老师带,学生轮流听模拟人,轮到最后一个时,前面的知识点早忘了;新人护士练腹部触诊,动作轻了没效果、重了不符合规范,老师要一个个纠正,一天下来最多带5个;甚至有些体检流程(比如神经系统检查)步骤多,学生记混顺序,实操时漏项错项频发——传统体检教学的核心痛点,就是“群体教学效率低、实操指导不及时、流程规范难落地”。
原创 22天前
66阅读
智慧AI群体化体格检查教学系统:破解体检教学“僧多粥少”难题
做技术的同学大概都有过这样的经历:线上出了个bug,明明去年老张解决过,可翻遍Confluence、Notion,甚至聊天记录,就是找不到关键步骤;新人入职,对着一堆零散的接口文档、部署手册,半个月还摸不清核心业务逻辑;自己写的解决方案,过三个月再看,都忘了当初为啥要这么设计——这就是传统知识管理的痛点:“存得住却用不好,看得见却找不着”。 而AI大模型知识管理平台,本质上是给技术团队的知识“装了
原创 22天前
59阅读
AI大模型知识管理平台:让技术团队的“隐性知识”不再沉睡
 10.1  决定下一步做什么 10.2  评估一个假设 10.3  模型选择和交叉验证集 10.4  诊断偏差和方差 10.5  归一化和偏差/方差 10.6  学习曲线 10.7  决定下一步做什么 10.1  决定下一步做什么     &nbs
在数字化浪潮中,企业每天都在产生海量数据——服务器日志、用户行为、交易记录、设备传感器信号……这些数据既是资产,也可能暗藏风险。一次系统崩溃、一场网络攻击、一笔异常交易,都可能造成巨大损失。传统监控靠人工盯屏、阈值告警,往往“后知后觉”,等发现问题时,损失已经发生。 这时候,AI预警数字化系统就像一位不知疲倦的“数字哨兵”,能提前发现异常、主动预警,把风险扼杀在萌芽状态。 那么,AI预警系统到底是
原创 23天前
55阅读
探索大模型能力边界Multimodal Model
LLM
原创 24天前
139阅读
L1G4000
在开发者社区里,我们常聊大模型如何写代码、做推理,但很少深入探讨它如何成为企业数据治理的“新范式”。今天,我们就从技术视角,拆解一个AI数据治理大模型系统的核心架构。 传统数据治理依赖人工规则和静态脚本,面对海量、多源、异构的数据,常常力不从心。而AI大模型的引入,不是简单地“加个AI”,而是重构了整个治理流程的底层逻辑。 第一,智能理解:从“看懂”数据开始。 系统的首要任务是理解数据。大模型通
原创 24天前
129阅读
拔俗AI数据治理大模型系统:用“智能大脑”管好企业数据家底
在软件开发和项目管理中,“评审”是至关重要的质量关卡。但传统评审往往依赖人工,效率低、主观性强、标准难统一。AI人工智能评审管理系统的出现,正是为了解决这些问题。它并非取代人类专家,而是通过一系列核心技术,为评审过程装上“智能导航”,让决策更高效、更客观。 核心技术一:自然语言处理(NLP),读懂评审内容 评审材料,无论是需求文档、设计稿还是代码注释,本质上都是文本。AI系统首先利用NLP技术(
本书深入浅出地介绍了深度学习中的序列模型及其发展历程,重点讲解了Transformer架构及其变体的原理与实战应用。全书共5章,旨在帮助读者从理论基础到实战应用,全面掌握Transformer技术。 第1章详细介绍RNN和LSTM的原理、代码实战及存在的问题与挑战。第2章全面剖析了Transformer的总体架构、核心思想及各组成部分的实现方法。第3章从自定义代码出发,详细地讲解了词嵌入、多头注意力层、前馈网络层、编码器层和解码器层的构建方法,以及如何训练Transformer模型。第4章介绍Transformer变体与进阶部分。第5章介绍利用Hugging Face实践Transformer,首先介绍了Hugging Face社区和Transformers库,然后通过实际应用案例,如文本分类、情感分类、命名实体识别等,展示了如何使用Transformers库进行项目开发。最后,讲解了模型微调的各种方法,以及Transformer的影响和未来展望。
原创 25天前
83阅读
Transformer原理解析及中文项目实践(微课视频版)