前言最近在用Java做一个文件格式转化的工具(github地址:https://github.com/lhing17/waterConverter.git),希望通过简单的调用实现一些常用格式间的互相转换,实质上是一些处理不同文件格式的工具包的整合。借此机会,也对Java怎么处理不同格式的文件有了更深入的了解,希望写一系列的文章作为记录。作为开篇,先来聊一聊什么是二进制文件,以及二进制文件到底是怎
在计算机中,整数值通常有两种类型:32位以及64位,在Java中分别对应的是int和long,
原创 2022-11-11 12:34:48
623阅读
Protocol Buffer技术详解(数据编码) - Stephen_Liu -
转载 2013-01-08 08:52:00
45阅读
2评论
kafka从0.11.0版本开始所使用的消息格式版本为v2,这个版本的消息相比于v0和v1的版本而言改动很大,同时还参考了ProtocolBuffer而引入了变长整型(Varints)和ZigZag编码。为了更加形象的说明问题,首先我们来了解一下变长整型。Varints是使用一个或多个字节来序列化整数的一种方法。数值越小,其所占用的字节数就越少。Varints中每个字节都有一个位于最高位的msb位
原创 精选 2019-05-23 14:58:22
3672阅读
持笔者新作:《深入理解Kafka:核心设计与实践原理...
原创 2021-09-01 14:34:21
231阅读
原创 2021-09-07 16:43:31
440阅读
,varint中的每个字节的最高位设为1,表示后面还有字节出现    
转载 2022-12-27 18:48:00
249阅读
Java 字符集 编码Java默认的字符集是Unicode(占两个字节byte,一个字节=8比特位bit)详解:字符集 编码Unicode 是「字符集」;UTF-8 是「编码规则」(是使用最广的一种 Unicode 的实现方式)字符集:为每一个字符分配一个唯一的ID(码位)编码规则:将码位转换为字节序列的规则(用什么方式存储)  英文/字节中文/字节Utf-8(变长)13Utf
转载 2023-05-19 14:09:08
108阅读
    主要区分清楚内码(internal encoding)和外码(external encoding)就好了。 内码是程序内部使用的字符编码,特别是某种语言实现其char或String类型在内存里用的内部编码; 外码是程序与外部交互时外部使用的字符编码。“外部”相对“内部”而言;不是char或String在内存里用的内部编码
转载 2023-06-05 16:31:50
256阅读
     Java编码     对于使用中文以及其他非拉丁语系语言的开发人员来说,经常会遇到字符集编码问题。对于Java语言来说,其内核和class文件使用的是UCS2编码(2个字节的Unicode编码)。这种编码并不属于某个语系的语言编码,它实际上是一种编码格式的世界语。在这个世界上所有可以在计算机中使用的语言都有对
转载 2023-06-02 00:31:24
332阅读
Unicode 是一种编码,所谓的编码就是一个编号(数字)到字符的一种映射关系,就仅仅是一种一对一的映射关系而已。
转载 2023-05-27 22:43:43
79阅读
       使用爬虫从网上抓取到一个网页内容,要想能正确显示,必须要获取网页的原始编码,否则会出现乱码。首先需要获取网页内容,最简单的办法就是通过JDK自带的HttpURLConnection类,要实现更复杂的抓取操作,请使用开源的爬虫框架,如Crawler4j,Web-Harvest,JSpider,WebMagic,Heritrix,Nutch等,我并
转载 2023-07-12 20:33:05
80阅读
1.导读随着软件项目代码的日积月累,系统维护成本变得越来越高,是所有软件团队面临的共同问题。持续地优化代码,提高代码的质量,是提升系统生命力的有效手段之一。软件系统思维有句话“Less coding, more thinking(少编码、多思考)”,也有这么一句俚语“Think more, code less(思考越多,编码越少)”。所以,我们在编码中多思考多总结,努力提升自己的编码水平,才能编写
转载 2024-06-04 21:09:37
31阅读
1. 其中​​ASCII​​、​​EBCDIC​​,以及中国的​​GBK​​、​​GB 2312​​都属于字符编码。由于世界上字符编码众多,不同国家不同地区都有不同的编码,这十分不方便计算机的国际化和本地化,所以出现了​​Unicode​​。
转载 2023-07-31 08:15:05
109阅读
ASCII 码 学过计算机的人都知道 ASCII 码,总共有 128 个,用一个字节的低 7 位表示,0~31 是控制字符如换行回车删除等;32~126 是打印字符,可以通过键盘输入并且能够显示出来。 ISO-8859-1 128 个字符显然是不够用的,于是 ISO 组织在 ASCII 码基础上又制定了一些列标准用来扩展 ASCII 编码,它们是 ISO-8859-1~ISO-8859-15
转载 2023-08-14 17:40:16
235阅读
一.编解码技术        基于Java提供的对象输入/输出ObjectInputStream和ObjectOutputStream,可以直接把Java对象作为可存储的字节数组写入文件,也可以传输到网络上,对于程序员来说,基于JDK默认的序列化机制可以避免操作底层字节数组,从而提升开发效率。      当进行进程跨进程的调用
要了解java的字符编码首先要弄清楚几个概念: 字符: 人们使用的记号,抽象意义上的一个符号 字节: 一个八位的计算机存储空间 字符串: 多个字符的表现形式。
转载 2023-05-27 19:51:40
58阅读
一.如何输出某一种编码的字符串String ss=new String(str.getBytes("ISO-8859-2"),"GBK"); ss=ss.trim(); //str.getBytes(Stringdecode)方法会根据指定的decode编码返回某字符串在该编码下的byte数组表 //这个new String(byte[],decode)实际是使用指定的编码decode来将by
转载 2023-06-14 20:01:33
135阅读
ok,今天搞了一天都在探索java字符的编码问题.十分头疼.最后终于得出几点:  1.网上有很多博客说判断一个String的编码的方法是通过如下代码;但其实这个代码完全是错的,用一种编码decode后,再encode,最后的结果是完全一样的.所以下面这个代码,不管用什么编码方式,结果都是true.1. String encode = "GB2312"; 2. try { 3
转载 2023-06-08 11:16:22
65阅读
工欲善其事,必先利其器,一款优秀的开发工具能够极大提高程序开发效率与体验。现在java开发用什么工具?在Web前端开发中,常用的开发工具有Visual Studio Code、Sublime Text、HBuilder等,下面我们就来介绍这些开发工具的特点。1.Visual Studio CodeVisual Studio Code(简称VS Code)是一款由微软公司开发的,功能十分强大的轻量级
  • 1
  • 2
  • 3
  • 4
  • 5