DIANA(Divisive Analysis)算法属于分裂的层次聚类,首先将所有的对象初始化到一个簇中,然后根据一些原则(比如最邻近的最大欧式距离),将该簇分类。 直到到达用户指定的簇数目或者两个簇之间的距离超过了某个阈值。簇的直径:在一个簇中的任意两个数据点都有一个欧氏距离,这些距离中的最大值是簇的直径平均相异度(平均距离)算法描述:- 输入:包含n个对象的数据库,终止条件簇的数目k - 输出
转载 2023-07-11 00:43:27
63阅读
目录定义样例算法Single LinkageComplete LinkageAverage LinkageCentroid LinkageWard总结 定义这个算法可以分为两部分理解,层次与聚类。首先聚类我在另一篇文章有讲过。具体请跳转【什么是聚类】。关于层次,就是把数据集聚成很多类以后,然后按照他们的距离构造成一个楼梯形状的簇数据。 层次聚类有两种聚类的方式:Agglomerative - 从
DIANA FEA是一款非常专业的有限元仿真软件,它具有并行处理的直接,迭代和特征求解器,而且还支持各种荷载类型和边界条件,该软件提供广泛的建模功能。 一种常见的建模方法是从定义的几何体创建有限元网格。
原创 精选 2021-08-19 21:14:30
1551阅读
机器学习入门核心算法:层次聚类算法(AGNES算法DIANA算法)一、算法逻辑二、算法原理与数学推导1. 距离度量2. 簇间距离计算(连接标准)3. 算法伪代码(凝聚式)三、模型评估1. 内部评估指标2. 外部评估指标(已知真实标签)3. 超参数选择四、应用案例1. 生物信息学2. 文档主题分层 ...
转载 21天前
424阅读
Link. Codeforces Luogu Description. 给定两棵森林,节点编号都是 \([1,n]\)。 每次操作选出两个节点 \(x\) 和 \(y\),满足在两棵树上 \(x\) 号节点均不和 \(y\) 号联通,并把他们相连。 最大化操作次数,并构造。 Solution. 设第 ...
转载 2021-08-20 20:19:00
127阅读
2评论
题目描述 有`A`、`B`两个各含有 $n$ 个点的森林,可以往两边都加入相同的边,问能最多加多少条且输出这些边。 数据范围 $n \le 10^5$ 题解 很巧妙的贪心题。 首先我们想最终状态,如果A是森林,那B一定是一棵树,因为A中的每两棵树之间的点在B间都是连通的,反之亦然。 所以我们可以在其 ...
转载 2021-08-18 20:40:00
38阅读
2评论
Python 文本相似度和聚类文本数据是非结构化的和高噪声的。在执行文本分类时,拥有标记合理的训练数据和有监督学习大有裨益。但是,文档聚类是一个无监督的学习过程,将尝试通过让机器学习各种各样的文本文档及其特征、相似度以及它们之间的差异,来讲文本 文档分割和分类为单独的类别。这使得文档聚类更具挑战性,也更有意思。考虑一个设计各种不同的概念和想法的文档语料库。人类以这样的方式将它们联系在一起,即使用过
转载 2023-07-24 20:17:28
72阅读
在ORACLE数据库(10.2.0.5.0)上修改一个包的时候,编译·
原创 2021-08-22 14:50:09
332阅读
CF1559D2 Mocha and Diana (Hard Version) 思路 以下,两图分别称为 A , B 首先,来证明一个贪心策略:有能连的边就连,或者说连边不会影响最大值 考虑一种特殊情况,A 只有两个联通块,记为 x 和 y , B 只有两个联通块 如果从 x 中选出任意一点都无法连 ...
转载 2021-08-17 21:57:00
55阅读
2评论
题目 题目链接:https://codeforces.com/contest/1559/problem/D2 给你两棵森林,节点数均为 \(n\)。第一个森林有 \(m_1\) 条边,第二个森林有 \(m_2\) 条边。 允许你进行加边操作,但是有两个要求: 如果在第一个森林加一条 \((u,v)\ ...
转载 2021-08-26 21:31:00
83阅读
2评论
考虑到加树边每次最多只导致一对联通块之间的状态。 所以我们以任意顺序加入当前的合法边。 我们考虑先加入所有可加的$(1,a)$ 然后统计只在$A$中与1连的点,$B$中与2连的点。 则他们间显然可以连上$\min(|S|,|H|)$。 ...
转载 2021-08-23 09:48:00
53阅读
2评论
题目 Problem - D2 给定两个不同的分别包含$n$个点的森林,每次可以同时在两个森林加一条相同的边,加边过程中不能出现环。问最多能加多少边,输出任一方案。\(n\le 10^5\) 题解 在submission上看到一个很吊的做法。 先确定一个根$rt$,比如1号结点,然后遍历每个点$u$ ...
转载 2021-08-17 11:51:00
67阅读
2评论
题面 考虑把每个点看成一个二元组 \((A, B)\) , \(A\) 和 \(B\) 分别表示这个点在第一个和第二个森林中处在的联通块的标号。 把这些 \((A, B)\) 画到坐标系上,发现有同一个纵坐标或同一个横坐标的两点无法连边。 设 \(x_1(a_1, b_1)\) 和 \(x_2(a_ ...
转载 2021-09-06 15:30:00
216阅读
2评论
原题链接:1559D1. Mocha and Diana (Easy Version) 题意: 小明和小红各有一个具有$n$个结点的森林,现执行操作: 加一条边,使得两人的森林还是森林 小明加一条$(u, v)\(的边,那么小红也必须加一条\)(u, v)$的边。 问我们最多能加多少边? 思路: 很 ...
转载 2021-08-16 10:21:00
210阅读
2评论
PS:这题官方好像给的要启发
原创 2023-02-09 00:17:45
76阅读
然然????嘿嘿 我的然然???? 给出两个森林,每次操作在两个森林中同时加入一条边$(u,v)$,要求加入这条边后两个图中剩下的都还是森林,求最多能操作几次。 easy版本直接$O(n^2)$枚举然后用并查集判断即可。 结论1:能加的边直接加,并不会使得答案变劣,因此直接加即可。 证明:每次加边只是在两个 ...
转载 2021-08-17 16:42:00
180阅读
传送门 相较于D1的$n^2$暴力。这次肯定不行了。这时我们就要想如何快速合并2片森林中所有的树呢。 首先可以加完边后两片森林依旧为森林,因此最多可以加的边数为边数多的那片森林确定。这样我们不妨令边数多的森林为第一片森林,可以加的最多的边即把第一片森林搞得只剩下一棵树。 在第一片森林中两棵树合并时, ...
转载 2021-09-02 21:53:00
44阅读
D2. Mocha and Diana (Hard Version) https://codeforces.com/contest/1559/problem/D2 题目大意 给出两个图,现在可以进行一个操作,就是选出两个点 \(x,y\),并且在两个图中给 $x,y$之间连一条边,这两个点必须满足连 ...
转载 2021-09-06 21:23:00
104阅读
2评论
一、算法简介1、定义算法是一组完成任务的指令;有限步骤内解决数学问题的程序;为解决某项工作或某个问题,所需要有限数量的机械性或重复性指令与计算步骤。2、算法的条件(5)输入性,输出性,明确性,有限性,有效性。3、时间复杂度O(1) < O(logn) < O(n) < O(nlogn) < O(n^2) < O(n!)4、常见的大O运行时间(n一般为元素的个数):O(
转载 2023-08-10 15:24:31
100阅读
1.算法定义 算法(Algorithm)是指解题方案的准确而完整的描述,是一系列解决问题的清晰指令,算法代表着用系统的方法描述解决问题的策略机制。也就是说,能够对一定规范的输入,在有限时间内获得所要求的输出。如果一个算法有缺陷,或不适合于某个问题,执行这个算法将不会解决这个问题。不同的算法可能用不同的时间、空间或效率来完成同样的任务。一个算法的优劣可以用空间复杂度与时间复杂度来衡量。一个
转载 2023-06-30 11:55:06
187阅读
  • 1
  • 2
  • 3
  • 4
  • 5