方案框架

下面描述了扫描笔的交互链路,从中可了解整个链路中各环节所起作用:

● 按压笔头开始扫描后,摄像头模组开始工作并将图片以 66fps(每秒传66张图)的形式传给 CSK 芯片,CSK 的作用是将传来的图片进行裁重,并从每次扫描的第二张图开始,计算出每张图的 横向与纵向偏移量;之后将裁重后的图片与偏移量信息通过 SPI 传给上位机;

● 上位机通过 SPI 收到 CSK 所传图片与偏移量信息后,将图片 每5帧 进行拼接后,通过 协议 传至云端OS

● 云端OS根据上位机图片与偏移量信息,进行在线拼接,将图片传输至 云端OS OCR 识别服务

● OCR 识别服务返回识别结果,此时 云端OS 再依次调用分词(仅支持中文)、**翻译 **与 TTS合成 服务;

● 云端OS原文识别结果译文结果原文TTS译文TTS 返回至上位机;

● 上位机进行屏幕展示与TTS播报,本次交互结束;


上位机选型

实例分享:扫描笔方案(OCR/TTS/语音识别)_扫描笔


CSK SDK简介

扫描笔SDK的设计宗旨为分层架构,从上往下共包括四层:

● 应用层:app部分

● SDK层:scanpen_sdk

● 适配层:lisa_porting

● 驱动层:平台驱动部分

在分层的设计基础上,统一应用和SDK接口,将适配层留出来,用于在不同芯片平台上做驱动和平台的适配,以实现在不同平台上都具有良好的移植性,既可以方便地进行SDK版本迭代,对于顶层应用而言,适配层统一了接口,底层的更新对于顶层是安全可靠的。


上位机开发参考

实例分享:扫描笔方案(OCR/TTS/语音识别)_OCR_02


更多学习资源

如果需要获取本教程相关的学习资源、代码,

或者了解更多与嵌入式开发、AI芯片相关的其他课程,可以点击查 看  目录导航。