android float double 精度问题 float类型的精度

转载

mob64ca141139a2 2023-10-17 09:19:04

文章标签 c语言浮点数单精度存储方式 文章分类 Android 移动开发

在程序中，小数一般都采用的是32位浮点型（float）的二进制存储，如果要使用小数计算，对于加、减、乘、除运算的数字和结果必须是实数上精确表示的。由于浮点数的特殊性，无法采用整数的补码存储方式，浮点数需要有特定的存储方式。IEEE754标准规定了浮点数在计算机中的存储方式以及算术标准等。一个浮点数可以分为3部分存储：

android float double 精度问题 float类型的精度_单精度

按照这种形式存储的数称为规约浮点数，一般C中的float、double都是采取的这种形式。通过这种存储方式，32位浮点数表示范围介于-1.18X10+38和3.40X10+38之间，虽然浮点数表示的范围很广，但存储的尾数只有23位，因此它并不能精确表示其范围内的所有数字。

比如，我们想计算1e+12，但这个数在浮点数中是不能精确表示的，所以对于精确计算，输入的数值为999999995904。

浮点数78.375的表示

android float double 精度问题 float类型的精度_c语言_02

浮点数精度

浮点数的精度指的是小数点后的有效数字位数，是由尾数的位数来决定的，对于单精度（float），它的尾数为23位，而2^23=8388608，共7位，也就是说最多能有7位有效数字，但至少能保证6位，因此32位浮点数的小数点后有效位为6~7位。C语言中浮点型一般分为float单精度型、double双精度型、long double长精度型，单精度浮点型小数点后面有效数字为6~7位和双精度浮点型小数点后面有效数字为15~16位。单精度为32位，双精度为64位，8位为一个字节。

在C语言标准库头文件float.h定义了浮点数小数点后的有效位数 :

//float.h头文件的部分代码
#define DBL_DIG 15 //双精度小数点后15位
#define FLT_DIG 6 //单精度小数点后6位
#define LDBL_DIG 19 //长双精度小数点19
 
可以用一段C程序来验证32位浮点数的存储值和精度：
#include <stdio.h>
int main(void)
{
         float k1=1e12;
         float k2=1;
         float f=4230.0;
         float y1=k1/f/f;
         float y2=k2/f/f;
         printf(“k1=  %f\n”,k1);
         printf(“y1=  %f\n”,y1);
         printf(“y2=  %f\n”,y2);
         return 0;
}
程序运行结果为：
k1=  999999995904.000000
y1=  55888.089844
y2=  0.000000

android float double 精度问题 float类型的精度_浮点数_03