蛙蛙推荐：从C#到C语言

原创

wx5abec29229781 2022-01-21 14:30:54 ©著作权

©著作权归作者所有：来自51CTO博客作者wx5abec29229781的原创作品，请联系作者获取转载授权，否则将追究法律责任

相信肯定有些人和我一样，没学过C语言，是从做网页开始学习编程的，直接从ASP学ASP.NET，从VBScript学到C#的。现在c#比较熟悉了，我们可以回过头来做一下C语言的入门，补一课。

介绍

学一门语言，最好的办法就先系统的看一遍教程，然后多多动手实践，我们拿老赵出的字符串提取信息的题目开始学习，题目要求如下：趣味编程：从字符串中提取信息老赵后来给出了c#的参考答案，用状态机实现的，如下趣味编程：从字符串中提取信息（参考答案 - 上）后来有给出了一个f#的版本，用了f#的模式匹配，如下趣味编程：从字符串中提取信息（参考答案 - 下）

现在我们参考c#的实现，再用C语言来实现一个，因为C语言和C#有很多区别，而我们比较熟悉c#语言，所以我们可以对比着来学习。首先要说的是c和c++是两门不同的语言，虽然c++编译器能编译c代码。下面的介绍中也会提到一些c和c++的区别。精通C语言不是特别难，如果要精通c++很难，C++的细节太多了。

C语言入门教程 http://zhuanti.club.it.sohu.com/user_webpage/webpages/commuser/web1_13497.html 初学者，你应当如何学习C++以及编程 http://club.it.sohu.com/read_elite.php?b=program&a=3473490

引入命名空间

c#有using语句用来引入一个命名空间，本文件就可以使用该命名空间下的类了，c语言里没有命名空间的概念，如果要使用C函数库里的函数的话，使用#include语句来把那个头文件包含进来就可以使用了，如下

#include <stdio.h>

但c++里就可以使用using来引入命名空间，比如

using namespace std;

类库 .net开发有.net framework，c没有这么强大的类库，但c也有一些标准的函数库，比如stdio.h里定义了输入输出的一些函数，stdlib.h定义了一些内存分配，类型转换等函数，math.h里定义了一下数学相关的函数。注意不要把c标准函数库和c++标准程序库混淆了，c++标准程序库比c标准函数库强大多了，增强了字符串相关的类，还有一些数据结构，异常处理方面的类。另外还有个c++标准模板库，就是STL，这个大概相当于.NET里System.Collections.Generic下的类，主要是有一些通用的容器的数据结构和用于查询数据的定位器，c语言只能用第一个，c标准函数库，另外两个都不能用。

c标准函数库 http://zh.wikipedia.org/zh-cn/C%E6%A8%99%E6%BA%96%E5%87%BD%E5%BC%8F%E5%BA%AB c++标准程序库 http://zh.wikipedia.org/zh-cn/C%2B%2B%E6%A8%99%E6%BA%96%E7%A8%8B%E5%BC%8F%E5%BA%AB c++标准模板库 http://zh.wikipedia.org/zh-cn/%E6%A0%87%E5%87%86%E6%A8%A1%E6%9D%BF%E5%BA%93

宏，枚举和常量

c语言里可以用#define宏和enum类型来定义常量，在程序中没有地方存它的值，在编译的时候就分配好内存了；而用const修饰的变量叫只读变量，需要在内存里开辟一个地方保存它的值，由编译器来标识它不可以修改。在c#里const和readonly关键字定义了编译时常量和运行时常量，这两种常量在使用上也有一些不同，比如a程序集定义了一个const常量，b程序集引用a程序集，a的const常量修改了后，b程序集要重新编译才能使修改生效，而如果a程序集里是用readonly定义的常量，b就不用重新编译。如下，定义了一个常量和3个只读变量

#define MAX_TOKEN_LEN  20

const e_arg_invalid = -1;
const e_token_overfllow = -2;
const s_ok = 0;

注意#define语句后面没有分号，关于常量和只读变量的更多的细节上的区别，见下面的链接

C语言程序设计之正确使用const http://tech.sina.com.cn/s/2004-09-17/0735426801.shtml CLR Via C# 学习笔记- 常量和字段（const readonly）

函数原型定义

在c#里，一个文件里一个函数无论定义在哪里，另一个函数都可以直接使用，但C语言里，一个函数的定义必须在它的使用之前，如果一个函数的定义在较靠后的地方，而上面有个函数要调用这个函数，就需要把被调用的这个函数在文件比较靠上的部分进行原型定义。原型定义就是把这个函数的签名写出来，表示下面会有这么一个函数，一般函数定义写在头文件里。如下就是对字符串状态解析用的5个函数的原型定义。

void* p1(char ch);
void* p2(char ch);
void* p3(char ch);
void* p4(char ch);
void* p5(char ch);

如何写出专业的C头文件 http://www.yuanma.org/data/2007/0523/article_2618.htm

函数指针

c#里的委托咱们都十分的熟悉，它指向一个方法链，执行它的话，这一串儿方法都会执行。在c里没有委托的概念，但有函数指针的概念，函数指针可以指向一个函数，调用这个函数指针，真正的方法也会调用（但会访问两次内存，效率比直接调用低），可如下c#代码如何用c来表示呢？

delegate StateParser StateParser(char ch);

StateParser这个委托的参数是char类型，但返回值又是它本身的类型，c语言虽然支持返回函数指针的函数，却不支持这种循环定义，所以我们需要一个无类型的指针void*来定义这个函数指针的返回值，然后再必要的时候进行类型转换，如下。

typedef void* (*fn_parse)(char c);

该语句定义了名为fn_parse的函数指针，它需要一个char类型的参数，并返回void*类型。本篇帖子的目的是为了学习c语言，其实这个题目用状态机来解，直接用几个状态处理函数之间相互调用就行，不定义StateParser这个委托就行，但现在我们来完全模仿老赵的c#实现。

LINQ

呵呵，C语言当然不会有LINQ了，更不会有string的Aggregate方法了，所以我们要自己实现一个aggregate方法，该方法需要两个参数，第一个参数是fn_parse类型的函数指针，第二个参数是一个字符串，遍历这个字符串，分别用每个字符作为参数去调用parse函数指针，并把其返回值也转换成fn_parse类型，然后用它去处理下一个参数。

蛙蛙推荐：从C#到C语言_c++ 蛙蛙推荐：从C#到C语言_c#_02 代码

void aggregate(fn_parse parse, const char* input){
     while(*input != '\0'){
        if(last_error == s_ok){
            parse = (fn_parse)(*parse)(*input);
            input++;
        }else{
            printf("ocurr an error:%d", last_error);
            break;
        }
     }
}

看下面这句

parse = (fn_parse)(*parse)(*input);

*用在一个指针的前面的时候是表示取值，*parse是取出函数指针parse所指向的函数,前面的(fn_parse)把返回的函数的地址void*转换成fn_parse类型，*input是取出input指针所指向的字符。

异常处理

c#里异常处理可以用try语句来实现结构化异常处理，在c里一般用返回码来做异常处理，我们先声明了一个全局变量last_error表示最后一次出现异常的错误码，然后定义了几个只读变量来表示可能的错误码，如下。

const e_arg_invalid = -1; /* 错误的参数*/
const e_token_overfllow = -2;/* 数组溢出 */
const s_ok = 0;
int last_error = 0;

c里只支持/**/括住的注释，c++里支持//格式的注释，我们在每调用一次函数之后，要判断last_error是否为s_ok，如果不是，说明函数执行出错了，上面的aggregate里就用了这样的异常处理机制。在函数的定义里，应该在函数的开始把last_error设置为s_ok，出错的时候设置为相应的错误码。

字符串

c#的字符串很强大，String类型有很多方法，而且.net 3.5又加了一些扩展方法，使用起来非常方面，c里就没这么方便了，c里的字符串是char的数组，并以\0结束。可以用char[]来表示，因为数组可以用指针表示，所以也可以用char*来表示。然后有一些库函数可以操作字符串，但都比较简单。c++里定义了string类型，以及支持多字节编码的wchar_t等类型，c/c++里的字符串由于历史原因有很多细节的问题，具体看下面的两个链接。

C++字符串完全指引之一 http://www.vckbase.com/document/viewdoc/?id=1082 C++字符串完全指引之二 http://www.vckbase.com/document/viewdoc/?id=1096

输入输出

c#里有Console.Write和Console.Read两个方法进行输入输出，在c里有printf和scanf，这两个函数可以进行格式化输出和输入，常用的%d表示int，%c表示字符，%s表示字符串，更详细的查看以下链接吧。 printf() 和 scanf() 使用

结构，类，面向对象

c语言是结构化语言，没有类，接口等面向对象的特性，但c里有struct，但struct不是一种类型，只是一种标识，不能用来声明变量，要声明变量前面还要加前缀struct，如下定义了一个token的结构，注意，结尾处有分号

struct token{
       char* inner_token;
       int index;
};

要声明一个这个结构类型的指针变量，用如下语句 struct token* current_token; c语言的结构不能定义成员函数，只能定义数据成员，但c++里可以。c语言里只能定义函数指针类型的成员，比如

struct token{
       char* inner_token;
       int index;
       void (*append)(struct token* t, char ch);
};

但这个函数指针指向的函数里不能用this，所以参数里还需要传入一个struct token*类型的参数，我觉得这种方式还不如定义一个纯粹的函数来的直接呢，如下

void append(struct token* t, char ch){
     if(t -> index++ > MAX_TOKEN_LEN){
         last_error = e_token_overfllow;
         return;
     }
     t -> inner_token[ t -> index ] = ch;
}

我们定义这个函数是往token里添加一个字符，在c#里用+操作符就可以把两个字符串拼接成一个新字符串，在c里我们要这么的大费周折，定义结构，定义函数啥的，其实在C语言里特意的去模拟面向对象也没什么好处，主要是把代码组织好就行了。其它的token_group,parse_result也以类似的方式定义了。有一个链接可以推荐给大家，如下： c的面向对象思想

内存管理

如果在一个函数里声明一个变量，在执行这个函数的时候它自动会在栈上分配内存，等函数执行完毕，这些内存会自动释放。如果是全局变量或者static变量的话，在编译时已经分配了好了内存，程序运行中会一直存在。如果在程序的逻辑里需要动态的创建一些对象，需要用malloc或calloc来动态分配内存，用free来释放动态分配的内存，如下reset函数用来创建一个token的新实例并赋值给current_token，用malloc来给自身分配内存，用calloc给其成员inner_token分配内存。

void reset(){
   current_token = (struct token*)malloc(sizeof(struct token));
   current_token -> inner_token = (char*)calloc(MAX_TOKEN_LEN, sizeof(char));
   current_token -> index = -1;
}

如下的函数用来释放一个动态创建的struct token对象的内存，先释放它的成员所分配的内存，然后释放它自己所分配的内存。

void dispose(struct token* t)
{
   free(t -> inner_token);
   free(t);   
}

C语言：malloc()函数与alloc()函数 http://webservices.ctocio.com.cn/net/437/9244937.shtml

c#里有自动垃圾回收功能，在C里没有，用C语言实现垃圾回收的帖子不太多，我找了几个，还没细看，如下浅议C 中的垃圾回收方法 http://www.abc188.com/info/html/chengxusheji/C-C--/20080224/9601.html 主题：我也研究下云风的垃圾回收库 http://www.javaeye.com/topic/352733 我写了一个C语言的GC库.用法是这样的: http://bbs.pfan.cn/post-220504.html

关于内存管理这块儿，还需要说一下static关键字，如果static修饰一个全局变量，它则改变了这个变量的作用域，表示这个全局变量只能在本文件里定义的函数里使用；如果static修饰一个函数内的局部变量，它则改变了这个变量的存储位置，默认函数内的局部变量是在栈上分配的，如果用static修饰，则它变成在全局存储区存储，在函数调用执行完后不会释放，如果一个函数要返回一个指针的话，这个返回的指针必须指向一个static修饰的局部变量，否则就会返回错误的指针。

难点分析——C语言之static变量声明的辨析 http://www.ccidedu.com/art/1925/20040927/159537_1.html c语言中static变量 http://doc.linuxpk.com/6049.html

函数

前面讲到过函数的原型是用来先声明有这么一个函数，然后函数就可以在下面定义了，处理本题目的5种解析状态的函数分别定义成p1到p5，和c#的差不多，比如p1如下

蛙蛙推荐：从C#到C语言_c++ 蛙蛙推荐：从C#到C语言_c#_02 代码

void* p1(char ch){
   if (ch == '-'){
      last_error = e_arg_invalid;
      return NULL;
   }
   if (ch == '\''){
      return p5;
   }
   else{
      append(current_token,  ch );
      return p4;
   }
}

主方法

以上定义好了用来解决这个问题的数据及操作这些数据的函数，那么再定义一个总的函数来对这些数据和函数进行单元测试吧，如下

蛙蛙推荐：从C#到C语言_c++ 蛙蛙推荐：从C#到C语言_c#_02 代码

void test_parse(){
   int i, j;
   struct token_group* group;
   struct token* t;

   reset();
   reset2();
   reset3();

   char* str = "cpu-3.0g--color-red-green-black--price-5000-8000--weight-'3-'--keywords-'levi''s'";
   aggregate(&p1, str);
   append2(current_group, current_token);
   append3(result, current_group );

   for(i = 0; i <= result -> index; i++){
      group = result -> groups[i];
      printf("group:%d\r\n", i);
      for(j = 0; j <= group -> index; j++){
         t = group -> tokens[j];
         printf("\ttoken:%d-%s\r\n", j, t -> inner_token);
      }      
   }

   for(i = 0; i <= result -> index; i++){
      group = result -> groups[i];
      for(j = 0; j <= group -> index; j++){
         t = group -> tokens[j];
         dispose(t);
      }
      dispose2(group);
   }
   dispose3(result);
}