一.整体介绍 项目大概从17年的5月份开始,那时候招了一个团队来做。两个大二的,三个大一的。后来慢慢摸索。暑假过后就没有人在项目组了。后来暑假重新找到了人重新开始。项目的整体目的是完成机器人识别人体姿态从而达到跟随或者是完成特定功能的效果。整体分为两个部分,一部分是完成turtlebot2机器人的环境搭建并且在从turtlebot2机器人上的奥比中光相机得到深度图,
前几天看一份代码临时需要找49个人脸关键点位置定义的图片发现怎么百度都搜不到,最后幸好谷歌可以使用了就用谷歌搜到了。所以在这里汇总一下我所知道的人脸关键点的定义和相关的一点东西,以备不时之需。68个关键点 最常用的工具是Dlib,网址:http://dlib.net/ dlib的68个特征点检测算法是ERT算法【1】 使用dlib检测68个特征点的python示例见:http://dlib.ne
前言CVer 前段时间分享了一个很棒的开源人脸检测:libfacedetection,详见:重磅!最快人脸检测开源2019年3月25日,Amusi 在github上发现 follow很久的左庆大佬刚push了一个项目:ZQCNN-MTCNN-vs-libfacedetection。点进去一看,原来是全面对比了 ZQCNN-MTCNN 与 libfacedetection。于是 Amusi 第一
OCR识别开源分析 OCR软件主要是由下面几个部分组成。   1. 图像输入、预处理:    2. 图像输入:对于不同的图像格式,有着不同的存储格式,不同的压缩方式。预处理:主要包括二值化,噪声去除,倾斜较正等    3. 二值化:    对摄像头拍摄的图片,大多数是彩色图像,彩色图像所含信息量巨大,对于图片的内容,我们可以简单的分为前景与背景,为了让计算机更快的
# Java人脸识别开源 ## 引言 人脸识别是一种通过计算机视觉技术来识别和验证人脸的方法。它已经广泛应用于人脸解锁、身份认证、安防监控等领域。为了方便开发人员使用,许多开源的人脸识别已经出现。本文将重点介绍一些常用的Java人脸识别开源,并提供一些代码示例。 ## 1. OpenCV OpenCV是一个开源的计算机视觉,其中包含了许多用于图像处理和分析的函数。它支持多种编程语言
原创 2023-08-13 12:43:05
667阅读
概要HyperLRP是一个开源的、基于深度学习高性能中文车牌识别,由北京智云视图科技有限公司开发,支持PHP、C/C++、Python语言,Windows/Mac/Linux/Android/IOS 平台。github地址: https://github.com/zeusees/HyperLPRTODO支持多种车牌以及双层支持大角度车牌轻量级识别模型特性速度快 720p,单核 Intel 2.2
转载 2023-12-09 17:10:06
326阅读
相比于其他的车牌识别系统,EasyPR有如下特点:它基于openCV这个开源,这意味着所有它的代码都可以轻易的获取。它能够识别中文,例如车牌为苏EUK722的图片,它可以准确地输出std:string类型的"苏EUK722"的结果。它的识别率较高。目前情况下,字符识别已经可以达到90%以上的精度。  系统还提供全套的训练数据提供(包括车牌检测的近500个车牌和字符识别的4000多个字符)。所有全
随着智能技术的快速发展,语音识别已经彻底改变了人与计算机之间的交互方式。在许多领域,企业特别依赖于语音识别技术来提高效率和用户体验。在Java社区中,有多种开源可供选择,但非常重要的是要根据项目的特定需求进行选择和配置。本文将通过背景定位、参数解析、调试步骤、性能调优、排错指南及最佳实践的结构,来深入探讨如何有效使用Java语音识别开源。 引用的用户反馈:“我们正在寻找一种可扩展的语音识别
原创 6月前
28阅读
纸张在许多地方已日益失宠,无纸化办公谈论40多年,办公环境正限制纸山的生成。而过去几年,无纸化办公的概念发生了显着的转变。在计算机软件的帮助 下,包含大量重要管理数据和资讯的文档可以更方便的以电子形式储存。扫描文档的好处不纯粹是存档理由。为了访问基于纸张的信息和将信息整合进数字工作流, 光学字符识别(OCR)技术至关重要。选择正确的OCR工具要基于特定需求而定,例如在线OCR服务对某些人有用,但
# Java 语音识别开源 在当今的信息时代,语音识别技术逐渐成为人们日常生活中不可或缺的一部分。无论是智能音箱、语音助手还是语音输入,都离不开语音识别技术的支持。而在 Java 开发领域,我们也可以利用开源来实现语音识别功能,为我们的应用程序增加更多交互方式。 ## 什么是语音识别开源? 语音识别开源是指由开发者社区共同维护和更新的一组 Java,用于处理语音识别相关的功能。
原创 2024-03-28 06:49:49
432阅读
0 Abstract局部时空特征能够在视频中捕获局部时间,同时能够适应大小、频率和移动模式的速度。在这片文章中我们阐述如何使用这些特征去识别复杂的移动模式。我们在局部时空特征的序列中构造视频表述,同时整合这些表述通过SVM分类器以达到识别目的。为了实现这样的结果,我们使用一个新的视频数据,包含25个人在4个不同场景下的6种行为行为识别的结果证明了提出的方法的有效性,同时验证了它比其它相关行为
目前开源世界里存在多种不同的语音识别工具包,它们为开发者构建应用提供了很大帮助。这些工具各有哪些优劣?数据科学公司 Silicon Valley Data Science 为我们带来了 5 种流行工具包的深度横向对比。作为深度学习研发团队的一员,我们对于循环神经网络(RNN)和其他语音识别需要用到的方法都有所涉及。在几年之前,业内较佳的语音识别系统还是基于语音分析的方法,包含发音、声学和语言模型。
早期的理论(特征分析理论、视觉计算理论和相互作用激活理论)的共同基本点:模式识别开始于对组成模式的简单部分或其局部性质的识别,然后才识别由这些简单部分构成的模式的结构关系。20世纪70年代初 Weistein & Harris  发现客体优势效应(object superiority effect)。实验:①     
# 视频人体行为识别Java实现 视频人体行为识别(Video Human Action Recognition)是计算机视觉领域的一项重要任务。它旨在从视频序列中检测和识别人体行为。这一技术在监控、体育分析和人机交互等多个领域都有着广泛的应用。本文将介绍如何使用Java实现基本的人体行为识别,并提供相关代码示例。 ## 行为识别的基本原理 人体行为识别通常涉及多个步骤,包括视频捕获、特
原创 2024-10-14 06:05:48
379阅读
ASRFrame没有什么是10层卷积解决不了的。如果有,就再来十层,再加个残差,再加个…再加个star吧!介绍项目链接:https://github.com/sailist/ASRFrame一个完整的语音识别框架,包括从数据清洗接口,数据读取接口到语音模型、声学模型、到最后的模型整合和UI的一整套流程目前声学部分拼音识别准确率已经比较高了,但语言模型仍然存在诸多问题需要解决,因此开源该项目,希望大
# Android 人脸识别开源入门 人脸识别技术在近几年得到了广泛应用,无论是安全监控、支付验证,还是社交应用,都能够看到它的身影。这篇文章将带你了解在 Android 平台上如何使用人脸识别开源,并通过一个简单的代码示例帮助你上手。 ## 什么是人脸识别? 人脸识别是通过分析人脸特征,从图像或视频中识别个体身份的一种技术。它通过多种算法提取人脸特征,并与数据中的特征进行比较,从而确
原创 11月前
478阅读
# Android 车牌识别开源的实现指南 在当今技术飞速发展的时代,车牌识别技术已经逐渐被广泛应用于各种智能交通应用中。实现一个Android车牌识别应用可能会让刚入行的小白感到困惑,但实际上,只要掌握了基本的步骤和代码,这个过程并不复杂。本文将为您提供一个详细的指导。 ## 实现流程 下面以表格的形式展示整个实现车牌识别的主要步骤: | 步骤 | 描述
原创 9月前
59阅读
Android OCR 识别开源是一个强大的工具,能够帮助开发者实现字符识别以处理图像中的文本。当开发者希望将其集成到 Android 应用程序中时,选择合适的 OCR 开源、进行适当的迁移、判断兼容性、并解决可能遇到的问题,将变得极为重要。以下便是我对如何解决 Android OCR 识别开源相关问题的详细记录。 ### 版本对比与兼容性分析 在选择 OCR 开源之前,有必要了解不同
原创 6月前
64阅读
# Android语音识别开源实现指南 ## 1. 简介 在本文中,我将教你如何使用开源来实现Android上的语音识别功能。我们将使用Google提供的SpeechRecognizer API,这是Android平台上最常用的语音识别之一。 ## 2. 准备工作 在开始之前,你需要确保你已经具备以下条件: - 你已经安装了Android开发环境,包括Android Studio和相关的
原创 2023-08-26 05:35:39
620阅读
最近公司要开发一款人脸识别的闸机,就是在现有闸机上将一个小屏的识别装置,人脸识别成功后将闸机打开。项目源码在 :https://gitee.com/panmingzhi/ArcSoftFace.git基于虹软人工智能开放平台技术开发 免费离线人脸识别SDK 戳此下载 1、首先我们选择的是windows 64位的动态,因为这个我熟悉,上手快。使用的是官方的开发,这里的是官方在githu
  • 1
  • 2
  • 3
  • 4
  • 5