1. 在utils.h和utils.c中完成16进制字符'0'-'9','A'-'F','a'-'f'与十六进制数据0-15的转换功能
2. 并写出测试代码测试上述函数(不能与下面代码一样)
3. **提交代码(或代码链接)和运行结果**
utils.h
1 #ifndef UTILS_H 2 #define UTILS_H 3 #include <stdio.h> 4 #include <time.h> 5 #include "darknet.h" 6 #include "list.h" 7 8 #define TIME(a) \ 9 do { \ 10 double start = what_time_is_it_now(); \ 11 a; \ 12 printf("%s took: %f seconds\n", #a, what_time_is_it_now() - start); \ 13 } while (0) 14 15 #define TWO_PI 6.2831853071795864769252866f 16 17 double what_time_is_it_now(); //获得当前时间 18 void shuffle(void *arr, size_t n, size_t size); //对数组进行洗牌操作 19 void sorta_shuffle(void *arr, size_t n, size_t size, size_t sections); // 对每一个sections进行洗牌操作 20 void free_ptrs(void **ptrs, int n); // 释放二维指针的内存空间 21 int alphanum_to_int(char c); // 字符转整数 22 char int_to_alphanum(int i); //整数转字符 23 int read_int(int fd); // 从文件fd中读取一个整数 24 void write_int(int fd, int n); // 向文件fd中写入一个整数 25 void read_all(int fd, char *buffer, size_t bytes); // 将内存中buffer起始的bytes个字节数据写入到fd文件中,一次性操作,若写不完,则报错 26 27 void write_all(int fd, char *buffer, size_t bytes); // 从fd文件中,读取bytes个字节数据到内存中buffer起始,一次性操作,若读不完,则报错 28 int read_all_fail(int fd, char *buffer, size_t bytes); // 从fd文件中,读取bytes个字节数据到内存中buffer起始,直到读完; 29 int write_all_fail(int fd, char *buffer, size_t bytes); // 将内存中buffer起始的bytes个字节数据写入到fd文件中,直到写完 30 void find_replace(char *str, char *orig, char *rep, char *output);// 判断str中是否出现子串,若出现则进行替代; 31 void malloc_error(); // 报错,内存分配出错 32 void file_error(char *s); // 报错,不能打开指定目录的文件 33 void strip(char *s); // 过滤掉字符数组中' '和'\t'以及'\n'三种字符 34 void strip_char(char *s, char bad); //过滤掉字符数组存在的指定字符 bad 35 list *split_str(char *s, char delim); 36 char *fgetl(FILE *fp); // 读取指定文件中的一行字符; 37 list *parse_csv_line(char *line); // 字符串切割,按照指定字符delim进行切割; 38 char *copy_string(char *s); //字符串拷贝操作 39 int count_fields(char *line); // 统计字符数组中有多少个 空格字符和','字符; 40 float *parse_fields(char *line, int n); // // 解析字符数组中的float实数 41 void translate_array(float *a, int n, float s); // 对向量进行平移操作, 42 float constrain(float min, float max, float a); // 判断小数a 与 区间小数[min, max]的关系,返回相应的值 43 int constrain_int(int a, int min, int max); // 判断整数a 与 区间整数[min, max]的关系,返回相应的值 44 float rand_scale(float s); // 随机采用的基础上,50%的概率返回S,50%的概率返回1/s 45 int rand_int(int min, int max); // 返回一个区间[min, max]内的一个整数 46 void mean_arrays(float **a, int n, int els, float *avg); // 求二维float数组,每一列的平均值,保存在avg一维float数组中 47 float dist_array(float *a, float *b, int n, int sub); // 当sub为1的时候,其实就是计算两个一维数组的欧式距离 48 float **one_hot_encode(float *a, int n, int k); // 进行one_hot 编码,根据,float数组a中的元素进行编码 49 float sec(clock_t clocks); // 获取秒数 50 void print_statistics(float *a, int n); // 计算向量的mean和var 51 int int_index(int *a, int val, int n); // 一维数组进行查找操作,若查找指定值,返回index,否则,返回-1; 52 53 #endif
utils.c
1 #include <stdio.h> 2 #include <stdlib.h> 3 #include <string.h> 4 #include <math.h> 5 #include <assert.h> 6 #include <unistd.h> 7 #include <float.h> 8 #include <limits.h> 9 #include <time.h> 10 #include <sys/time.h> 11 12 #include "utils.h" 13 14 15 /* 16 // old timing. is it better? who knows!! 17 double get_wall_time() 18 { 19 struct timeval time; 20 if (gettimeofday(&time,NULL)){ 21 return 0; 22 } 23 return (double)time.tv_sec + (double)time.tv_usec * .000001; 24 } 25 */ 26 27 // 获得当前时间,到秒的时间戳,并对微秒进行四舍五入。 28 // tv_usrc 获取到微秒,需要10^-6转换为秒 29 double what_time_is_it_now() 30 { 31 // 32 struct timeval time; 33 if (gettimeofday(&time,NULL)){ 34 return 0; 35 } 36 return (double)time.tv_sec + (double)time.tv_usec * .000001; 37 } 38 39 40 // 读取初始gpu_list,获得gpu id编号 41 int *read_intlist(char *gpu_list, int *ngpus, int d) 42 { 43 int *gpus = 0; 44 // 如果gpu_list不为空,gpu_list = "*,*,*,*," 45 if(gpu_list){ 46 int len = strlen(gpu_list); 47 *ngpus = 1; 48 int i; 49 // 通过计数","的个数来统计gpu的个数 50 for(i = 0; i < len; ++i){ 51 if (gpu_list[i] == ',') ++*ngpus; 52 } 53 // 分配存储空间 54 gpus = calloc(*ngpus, sizeof(int)); 55 // 将GPU编号保存到 gpus int型数组中 56 for(i = 0; i < *ngpus; ++i){ 57 //将gpu_list前面的字符转换成整数,atoi碰到不能转换的符号,停止转换,例: "123.45" 转换结果 "123"; "123,45" 转换结果 "123" 58 gpus[i] = atoi(gpu_list); 59 // 更新gpu_list,已经保存到gpus中要过滤掉, strchr 查找某字符的index,返回从该index开始的子字符数组; 60 gpu_list = strchr(gpu_list, ',')+1; 61 } 62 } else {// gpu_list 为空, 63 gpus = calloc(1, sizeof(float)); 64 *gpus = d; // 指定编号d的gpu 65 *ngpus = 1; 66 } 67 return gpus; // 返回的gpus 可能是一个int数组,也有可能是一个int整数,具体看gpu_list 68 } 69 70 // 读取指定文件中,每一行的最开始的整数,保存到一维数组中,数组长度为文件的有效行数。 71 int *read_map(char *filename) 72 { 73 int n = 0; 74 int *map = 0; 75 char *str; 76 FILE *file = fopen(filename, "r"); 77 if(!file) file_error(filename); // 未成功读取文件,报错 78 while((str=fgetl(file))){ //逐行读取 79 ++n; 80 map = realloc(map, n*sizeof(int)); 81 map[n-1] = atoi(str); // 根据此语句可以得知,在file 每一行的开始处读取一个整数,保存到 map数组的末尾; 82 } 83 return map; 84 } 85 86 // 对每一个sections进行洗牌操作 87 void sorta_shuffle(void *arr, size_t n, size_t size, size_t sections) 88 { 89 size_t i; 90 for(i = 0; i < sections; ++i){ 91 size_t start = n*i/sections; 92 size_t end = n*(i+1)/sections; 93 size_t num = end-start; 94 shuffle(arr+(start*size), num, size); 95 } 96 } 97 98 // 对数组进行洗牌操作 99 void shuffle(void *arr, size_t n, size_t size) 100 { 101 size_t i; 102 void *swp = calloc(1, size); //分配一个1个长度为size的连续空间 103 for(i = 0; i < n-1; ++i){ 104 size_t j = i + rand()/(RAND_MAX / (n-i)+1); //进行洗牌操作 105 memcpy(swp, arr+(j*size), size); 106 memcpy(arr+(j*size), arr+(i*size), size); 107 memcpy(arr+(i*size), swp, size); 108 } 109 } 110 111 // index 洗牌操作 112 int *random_index_order(int min, int max) 113 { 114 int *inds = calloc(max-min, sizeof(int)); // 申请存储空间 115 int i; 116 for(i = min; i < max; ++i){ // 初始化 117 inds[i] = i; 118 } 119 for(i = min; i < max-1; ++i){ // 洗牌操作 120 int swap = inds[i]; 121 int index = i + rand()%(max-i); 122 inds[i] = inds[index]; 123 inds[index] = swap; 124 } 125 return inds; 126 } 127 128 // 从第index+1开始,将argv元素向左移动,最后一个元素置null 129 void del_arg(int argc, char **argv, int index) 130 { 131 int i; 132 for(i = index; i < argc-1; ++i) argv[i] = argv[i+1]; 133 argv[i] = 0; 134 } 135 136 // 删除指定字符串 arg,其后面的字符串往左移动 137 int find_arg(int argc, char* argv[], char *arg) 138 { 139 int i; 140 for(i = 0; i < argc; ++i) { 141 if(!argv[i]) continue; 142 if(0==strcmp(argv[i], arg)) { 143 del_arg(argc, argv, i); 144 return 1; 145 } 146 } 147 return 0; 148 } 149 150 // 找到指定 arg, 后面的参数往左一定两个位置 151 int find_int_arg(int argc, char **argv, char *arg, int def) 152 { 153 int i; 154 for(i = 0; i < argc-1; ++i){ 155 if(!argv[i]) continue; 156 if(0==strcmp(argv[i], arg)){ 157 def = atoi(argv[i+1]); 158 del_arg(argc, argv, i); 159 del_arg(argc, argv, i); 160 break; 161 } 162 } 163 return def; 164 } 165 166 // 同理 167 float find_float_arg(int argc, char **argv, char *arg, float def) 168 { 169 int i; 170 for(i = 0; i < argc-1; ++i){ 171 if(!argv[i]) continue; 172 if(0==strcmp(argv[i], arg)){ 173 def = atof(argv[i+1]); 174 del_arg(argc, argv, i); 175 del_arg(argc, argv, i); 176 break; 177 } 178 } 179 return def; 180 } 181 182 // 同理 183 char *find_char_arg(int argc, char **argv, char *arg, char *def) 184 { 185 int i; 186 for(i = 0; i < argc-1; ++i){ 187 if(!argv[i]) continue; 188 if(0==strcmp(argv[i], arg)){ 189 def = argv[i+1]; 190 del_arg(argc, argv, i); 191 del_arg(argc, argv, i); 192 break; 193 } 194 } 195 return def; 196 } 197 198 199 // 提取cfg文件的文件名, 200 char *basecfg(char *cfgfile) 201 { 202 char *c = cfgfile; 203 char *next; 204 // 查找到最后一个 '/', 只要最后一个'/'后面的内容 205 while((next = strchr(c, '/'))) 206 { 207 c = next+1; 208 } 209 c = copy_string(c); // 重新分配一块内存进行存储 210 next = strchr(c, '.'); //查找后缀 211 if (next) *next = 0; //后面置null 212 return c; 213 } 214 215 // 字符转整数 216 int alphanum_to_int(char c) 217 { 218 return (c < 58) ? c - 48 : c-87; 219 } 220 221 // 整数转字符 222 char int_to_alphanum(int i) 223 { 224 if (i == 36) return '.'; 225 return (i < 10) ? i + 48 : i + 87; 226 } 227 228 // 可视化一维float数组,M×N列 229 void pm(int M, int N, float *A) 230 { 231 int i,j; 232 for(i =0 ; i < M; ++i){ 233 printf("%d ", i+1); 234 for(j = 0; j < N; ++j){ 235 printf("%2.4f, ", A[i*N+j]); 236 } 237 printf("\n"); 238 } 239 printf("\n"); 240 } 241 242 // 判断str中是否出现子串,若出现则进行替代; 243 void find_replace(char *str, char *orig, char *rep, char *output) 244 { 245 char buffer[4096] = {0}; 246 char *p; 247 248 sprintf(buffer, "%s", str); 249 if(!(p = strstr(buffer, orig))){ // Is 'orig' even in 'str'? // 判断orig是否是buffer的子串,若是返回orig在buffer的起始地址,否则返回null 250 sprintf(output, "%s", str); 251 return; 252 } 253 254 *p = '\0'; // 因为sprintf拼接必须是'\0'结尾的字符数组; 255 256 sprintf(output, "%s%s%s", buffer, rep, p+strlen(orig)); // 拼接,用rep 替代 buffer中的orig部分,其余不变,如: str = "1qaz", rep = "3344", orig = "qa"; output = "1q" + '\0' + "3344"+"z" 257 } 258 259 // 获取秒数 260 float sec(clock_t clocks) 261 { 262 return (float)clocks/CLOCKS_PER_SEC; 263 } 264 265 // 返回float数组a中top-k,index数组保存从 top-k的角标; 266 void top_k(float *a, int n, int k, int *index) 267 { 268 int i,j; 269 for(j = 0; j < k; ++j) index[j] = -1; // index数组初始化,全部置为-1, 长度k 270 for(i = 0; i < n; ++i){ 271 int curr = i; 272 for(j = 0; j < k; ++j){ 273 if((index[j] < 0) || a[curr] > a[index[j]]){ // 交换两者index 274 int swap = curr; 275 curr = index[j]; 276 index[j] = swap; 277 } 278 } 279 } 280 } 281 282 void error(const char *s) 283 { 284 perror(s); // perror()函数先打印字符数组 s ,然后打印出错的原因 285 assert(0); // 报错 286 exit(-1); 287 } 288 289 // 将一个文件中的内容,一次性读取完; 290 unsigned char *read_file(char *filename) 291 { 292 FILE *fp = fopen(filename, "rb"); 293 size_t size; 294 295 fseek(fp, 0, SEEK_END); //将fp流指针移动到文件结尾; 296 size = ftell(fp); //获取文件长度 297 fseek(fp, 0, SEEK_SET); // 将fp流指针移动文件开头 298 299 unsigned char *text = calloc(size+1, sizeof(char)); // 申请存储空间 300 fread(text, 1, size, fp); // 1表示每个数据项的字节数,size表示要读的数据项个数,fp流指针,text内存地址 301 fclose(fp); 302 return text; 303 } 304 305 // 报错,内存分配出错 306 void malloc_error() 307 { 308 fprintf(stderr, "Malloc error\n"); 309 exit(-1); 310 } 311 312 // 报错,不能打开指定目录的文件 313 void file_error(char *s) 314 { 315 fprintf(stderr, "Couldn't open file: %s\n", s); 316 exit(0); //程序运行正常退出 317 } 318 319 // 字符串切割,按照指定字符delim进行切割; 320 list *split_str(char *s, char delim) 321 { 322 size_t i; 323 size_t len = strlen(s); 324 list *l = make_list(); 325 list_insert(l, s); 326 for(i = 0; i < len; ++i){ 327 if(s[i] == delim){ 328 s[i] = '\0'; 329 list_insert(l, &(s[i+1])); 330 } 331 } 332 return l; 333 } 334 335 // 过滤掉字符数组存在的 ' ' 和 '\t' 以及 '\n' 三种字符 336 void strip(char *s) 337 { 338 size_t i; 339 size_t len = strlen(s); 340 size_t offset = 0; 341 for(i = 0; i < len; ++i){ 342 char c = s[i]; 343 if(c==' '||c=='\t'||c=='\n') ++offset; 344 else s[i-offset] = c; 345 } 346 s[len-offset] = '\0'; 347 } 348 349 // 过滤掉字符数组存在的指定字符 bad 350 void strip_char(char *s, char bad) 351 { 352 size_t i; 353 size_t len = strlen(s); 354 size_t offset = 0; 355 for(i = 0; i < len; ++i){ 356 char c = s[i]; 357 if(c==bad) ++offset; 358 else s[i-offset] = c; 359 } 360 s[len-offset] = '\0'; 361 } 362 363 // 释放二维指针的内存空间 364 void free_ptrs(void **ptrs, int n) 365 { 366 int i; 367 for(i = 0; i < n; ++i) free(ptrs[i]); 368 free(ptrs); 369 } 370 371 372 // 读取指定文件中的一行字符; 373 char *fgetl(FILE *fp) 374 { 375 if(feof(fp)) return 0; // feof()检测流文件指针是否已到文件结尾。文件读取结束,返回非0,否则返回0. 376 size_t size = 512; 377 char *line = malloc(size*sizeof(char)); // 申请512个字符空间 378 if(!fgets(line, size, fp)){ //fgets 读取文件中一行的数据,存放到line中.读取失败或读取到换行符或读取到文件末尾返回,读取fgets失败返回null 379 free(line); 380 return 0; 381 } 382 383 size_t curr = strlen(line); 384 385 386 // 读取未满一行时 387 while((line[curr-1] != '\n') && !feof(fp)){ 388 if(curr == size-1){ // 扩充 389 size *= 2; 390 line = realloc(line, size*sizeof(char)); 391 if(!line) { 392 printf("%ld\n", size); 393 malloc_error(); 394 } 395 } 396 size_t readsize = size-curr; 397 if(readsize > INT_MAX) readsize = INT_MAX-1; // 不能超过INTMAX,上溢 398 fgets(&line[curr], readsize, fp); // 读取其余部分 399 curr = strlen(line); 400 } 401 if(line[curr-1] == '\n') line[curr-1] = '\0'; // index n-1处为'\n'表示读完了一行,将其修改为'\0',因为字符数组默认结果为'\0',需手动补上 402 403 return line; 404 } 405 406 // 从文件fd中读取一个整数 407 int read_int(int fd) 408 { 409 int n = 0; 410 int next = read(fd, &n, sizeof(int)); // next为成功读取的字节数,如果为-1,则表示读取失败,若调read之前已经到达文件末尾,则这次read返回0. 411 if(next <= 0) return -1; 412 return n; 413 } 414 415 // 向文件fd中写入一个整数 416 void write_int(int fd, int n) 417 { 418 int next = write(fd, &n, sizeof(int)); 419 if(next <= 0) error("read failed"); 420 } 421 422 // 从fd文件中,读取bytes个字节数据到内存中buffer起始,直到读完; 423 int read_all_fail(int fd, char *buffer, size_t bytes) 424 { 425 size_t n = 0; 426 while(n < bytes){ 427 int next = read(fd, buffer + n, bytes-n); 428 if(next <= 0) return 1; 429 n += next; 430 } 431 return 0; 432 } 433 434 // 将内存中buffer起始的bytes个字节数据写入到fd文件中,直到写完 435 int write_all_fail(int fd, char *buffer, size_t bytes) 436 { 437 size_t n = 0; 438 while(n < bytes){ 439 size_t next = write(fd, buffer + n, bytes-n); // 将buffer+n 所指向的内存写入bytes-n个字节到fd文件中; 440 if(next <= 0) return 1; //如果写入成功,会返回写入的字节数,即返回 bytes,否则,返回-1【写入失败】; 441 n += next; // n变成 n+bytes, 442 } // while 循环这么去写,可以保证全部bytes字节数写入到文件fd中 443 return 0; 444 } 445 446 // 将内存中buffer起始的bytes个字节数据写入到fd文件中,一次性操作,若写不完,则报错 447 void read_all(int fd, char *buffer, size_t bytes) 448 { 449 size_t n = 0; 450 while(n < bytes){ 451 int next = read(fd, buffer + n, bytes-n); 452 if(next <= 0) error("read failed"); 453 n += next; 454 } 455 } 456 457 // 从fd文件中,读取bytes个字节数据到内存中buffer起始,一次性操作,若读不完,则报错 458 void write_all(int fd, char *buffer, size_t bytes) 459 { 460 size_t n = 0; 461 while(n < bytes){ 462 size_t next = write(fd, buffer + n, bytes-n); 463 if(next <= 0) error("write failed"); 464 n += next; 465 } 466 } 467 468 469 470 // 字符数组的复制操作 471 char *copy_string(char *s) 472 { 473 char *copy = malloc(strlen(s)+1); 474 strncpy(copy, s, strlen(s)+1); //将以s地址开始的前strlen(s) + 1 个字节复制到copy所指向的数组中 475 return copy; 476 } 477 478 479 // 解析某种特定格式,如: "******, "222,"32242, "342423 480 list *parse_csv_line(char *line) 481 { 482 list *l = make_list(); // 链表初始化 483 char *c, *p; 484 int in = 0; 485 // 遍历字符数组line 486 for(c = line, p = line; *c != '\0'; ++c){ 487 if(*c == '"') in = !in; // 遇到 " 字符,则in=1 488 else if(*c == ',' && !in){ 489 *c = '\0'; 490 list_insert(l, copy_string(p)); // 链表中元素的是一个字符数组,并且 包含 " 字符, 遇到','结束 491 p = c+1; 492 } 493 } 494 // 插入剩下的部分 495 list_insert(l, copy_string(p)); 496 return l; 497 } 498 499 // 统计字符数组中有多少个 空格字符和','字符; 500 int count_fields(char *line) 501 { 502 int count = 0; 503 int done = 0; 504 char *c; 505 for(c = line; !done; ++c){ 506 done = (*c == '\0'); 507 if(*c == ',' || done) ++count; 508 } 509 return count; 510 } 511 512 // 解析字符数组中的float实数 513 float *parse_fields(char *line, int n) 514 { 515 float *field = calloc(n, sizeof(float)); // 申请n个float存储空间 516 char *c, *p, *end; 517 int count = 0; 518 int done = 0; 519 for(c = line, p = line; !done; ++c){ 520 done = (*c == '\0'); 521 if(*c == ',' || done){ 522 *c = '\0'; 523 field[count] = strtod(p, &end); //strtod将字符串转换为float类型 ,会过滤遇到的空格字符,直到遇到数字或者+/- 才开始转换,到出现非数字或者字符串结束符'\0'结束;end, 524 if(p == c) field[count] = nan(""); // 转换数字开始位置指针p 和 工作指针c指向同一地址,表明,一开始就遇到','或者'\0',肯定不合理,使用nan函数 525 // 如果转换合理,应该end和c指向同一位置,end表示余下未转换的起始位置,c为当前工作位置; 526 if(end != c && (end != c-1 || *end != '\r')) field[count] = nan(""); //DOS file formats! 527 p = c+1; 528 ++count; 529 } 530 } 531 return field; 532 } 533 534 // 对float一维数组求和 535 float sum_array(float *a, int n) 536 { 537 int i; 538 float sum = 0; 539 for(i = 0; i < n; ++i) sum += a[i]; 540 return sum; 541 } 542 543 // 对float一维数组求均值 544 float mean_array(float *a, int n) 545 { 546 return sum_array(a,n)/n; 547 } 548 549 // 求二维float数组,每一列的平均值,保存在avg一维float数组中 550 void mean_arrays(float **a, int n, int els, float *avg) 551 { 552 int i; 553 int j; 554 memset(avg, 0, els*sizeof(float));// 申请els个float存储空间 555 for(j = 0; j < n; ++j){ 556 for(i = 0; i < els; ++i){ 557 avg[i] += a[j][i]; // 计算每列元素之和,共els列 558 } 559 } 560 for(i = 0; i < els; ++i){ 561 avg[i] /= n; // avg中保存是每一列的平均值 562 } 563 } 564 565 // 计算向量的mean和var 566 void print_statistics(float *a, int n) 567 { 568 float m = mean_array(a, n); 569 float v = variance_array(a, n); 570 printf("MSE: %.6f, Mean: %.6f, Variance: %.6f\n", mse_array(a, n), m, v); 571 } 572 573 // 对float一维数组求方差 574 float variance_array(float *a, int n) 575 { 576 int i; 577 float sum = 0; 578 float mean = mean_array(a, n); // 求平均值 579 // 求方差 580 for(i = 0; i < n; ++i) sum += (a[i] - mean)*(a[i]-mean); 581 float variance = sum/n; 582 return variance; 583 } 584 585 // 判断整数a 与 区间整数[min, max]的关系,返回相应的值 586 int constrain_int(int a, int min, int max) 587 { 588 if (a < min) return min; 589 if (a > max) return max; 590 return a; 591 } 592 593 // 判断小数a 与 区间小数[min, max]的关系,返回相应的值 594 float constrain(float min, float max, float a) 595 { 596 if (a < min) return min; 597 if (a > max) return max; 598 return a; 599 } 600 601 // 当sub为1的时候,其实就是计算两个一维数组的欧式距离 602 float dist_array(float *a, float *b, int n, int sub) 603 { 604 int i; 605 float sum = 0; 606 for(i = 0; i < n; i += sub) sum += pow(a[i]-b[i], 2); 607 return sqrt(sum); 608 } 609 610 // 向量的模长除以N 611 float mse_array(float *a, int n) 612 { 613 int i; 614 float sum = 0; 615 for(i = 0; i < n; ++i) sum += a[i]*a[i]; 616 return sqrt(sum/n); 617 } 618 619 // 归一化操作, 620 void normalize_array(float *a, int n) 621 { 622 int i; 623 float mu = mean_array(a,n); 624 float sigma = sqrt(variance_array(a,n)); 625 for(i = 0; i < n; ++i){ 626 a[i] = (a[i] - mu)/sigma; 627 } 628 mu = mean_array(a,n); 629 sigma = sqrt(variance_array(a,n)); 630 } 631 632 // 对向量进行平移操作, 633 void translate_array(float *a, int n, float s) 634 { 635 int i; 636 for(i = 0; i < n; ++i){ 637 a[i] += s; 638 } 639 } 640 641 // 求向量a的模长 642 float mag_array(float *a, int n) 643 { 644 int i; 645 float sum = 0; 646 for(i = 0; i < n; ++i){ 647 sum += a[i]*a[i]; 648 } 649 return sqrt(sum); 650 } 651 652 // 向量的与实数的乘法 653 void scale_array(float *a, int n, float s) 654 { 655 int i; 656 for(i = 0; i < n; ++i){ 657 a[i] *= s; 658 } 659 } 660 661 // 感觉就是从向量中采用一个数,返回其index 662 int sample_array(float *a, int n) 663 { 664 float sum = sum_array(a, n); 665 scale_array(a, n, 1./sum); // 对向量进行单位化(不知道这么叫对不对) 666 float r = rand_uniform(0, 1); // 产生一个[0,1]的随机数 667 int i; 668 for(i = 0; i < n; ++i){ 669 r = r - a[i]; 670 if (r <= 0) return i; // 找到第一个小于0的数 671 } 672 return n-1; 673 } 674 675 // 一维int数组找最大值操作,若找到最大值,返回index,否则,返回-1; 676 int max_int_index(int *a, int n) 677 { 678 if(n <= 0) return -1; 679 int i, max_i = 0; 680 int max = a[0]; 681 for(i = 1; i < n; ++i){ 682 if(a[i] > max){ 683 max = a[i]; 684 max_i = i; 685 } 686 } 687 return max_i; 688 } 689 690 // 一维float数组找最大值操作,若找到最大值,返回index,否则,返回-1; 691 int max_index(float *a, int n) 692 { 693 if(n <= 0) return -1; 694 int i, max_i = 0; 695 float max = a[0]; 696 for(i = 1; i < n; ++i){ 697 if(a[i] > max){ 698 max = a[i]; 699 max_i = i; 700 } 701 } 702 return max_i; 703 } 704 705 // 一维数组进行查找操作,若查找指定值,返回index,否则,返回-1; 706 int int_index(int *a, int val, int n) 707 { 708 int i; 709 for(i = 0; i < n; ++i){ 710 if(a[i] == val) return i; 711 } 712 return -1; 713 } 714 715 // 返回一个区间[min, max]内的一个整数 716 int rand_int(int min, int max) 717 { 718 if (max < min){ 719 int s = min; 720 min = max; 721 max = s; 722 } 723 int r = (rand()%(max - min + 1)) + min; 724 return r; 725 } 726 727 // From http://en.wikipedia.org/wiki/Box%E2%80%93Muller_transform 728 // 标准正太分布 729 float rand_normal() 730 { 731 static int haveSpare = 0; 732 static double rand1, rand2; 733 734 if(haveSpare) 735 { 736 haveSpare = 0; 737 return sqrt(rand1) * sin(rand2); 738 } 739 740 haveSpare = 1; 741 // 获取区间[0,1]内的一个随机数 742 rand1 = rand() / ((double) RAND_MAX); 743 // 不能太小 744 if(rand1 < 1e-100) rand1 = 1e-100; 745 rand1 = -2 * log(rand1); 746 rand2 = (rand() / ((double) RAND_MAX)) * TWO_PI; 747 748 return sqrt(rand1) * cos(rand2); 749 } 750 751 /* 752 float rand_normal() 753 { 754 int n = 12; 755 int i; 756 float sum= 0; 757 for(i = 0; i < n; ++i) sum += (float)rand()/RAND_MAX; 758 return sum-n/2.; 759 } 760 */ 761 762 size_t rand_size_t() 763 { 764 return ((size_t)(rand()&0xff) << 56) | 765 ((size_t)(rand()&0xff) << 48) | 766 ((size_t)(rand()&0xff) << 40) | 767 ((size_t)(rand()&0xff) << 32) | 768 ((size_t)(rand()&0xff) << 24) | 769 ((size_t)(rand()&0xff) << 16) | 770 ((size_t)(rand()&0xff) << 8) | 771 ((size_t)(rand()&0xff) << 0); 772 } 773 774 // 进行随机采样操作,从区间[min, max]随机返回一个实数 775 float rand_uniform(float min, float max) 776 { 777 if(max < min){ 778 float swap = min; 779 min = max; 780 max = swap; 781 } 782 return ((float)rand()/RAND_MAX * (max - min)) + min; 783 } 784 785 // 随机采用的基础上,50%的概率返回S,50%的概率返回1/s 786 float rand_scale(float s) 787 { 788 float scale = rand_uniform(1, s); 789 if(rand()%2) return scale; 790 return 1./scale; 791 } 792 793 // 进行one_hot 编码,根据,float数组a中的元素进行编码 794 float **one_hot_encode(float *a, int n, int k) 795 { 796 int i; 797 float **t = calloc(n, sizeof(float*)); // 申请n个float * 指针存储空间 798 for(i = 0; i < n; ++i){ 799 t[i] = calloc(k, sizeof(float)); // 每个t中的元素为一个float 指针,指向k个float 800 int index = (int)a[i]; // 丢掉小数部分 801 t[i][index] = 1; //第index 置为1 802 } 803 return t; 804 }