Golang构建Python高性能模块

虽然Python优点很多,但是有一个致命的缺点就是运行速度太慢,那么Python程序需要一些计算量比较大的模块时一般会调用c或者c++的代码来重写,但是c/c++编写代码代价太高,耗费太多的人力,开发周期太长,那么就想到来一个折中的方法是用golang语言。

虽然golang性能比不上c、c++,但是golang天生的高并发,以及编译速度超级快,而且还自带垃圾回收机制,不用开发者自己去管理内存,开发效率高。所以在Python程序遇到大计算量时,可以考虑调用go模块。接下来我们来看看如何在利用go模块写Python第三方模块,以及如何在Python中导入并调用。

下面构建一个go python 模块:

package main
import "C"

//指定那些函数能被外部调用
//export test
func test()  int{
    //计算 0-100000 的和
    var s int
    for a := 0; a <= 1000000; a++ {
        s += a 
     }
     return s
} 

func main(){
}

  

编译生成动态链接库,生成的.so文件可以被python加载并调用

但是有一个需要注意的地方:

Python是利用ctypes来跟so模块进行交互,其中存在着一个代码的翻译过程,包括数据类型的翻译,如果需要传参获取接收返回值,需要在golang中将参数按照下表对应,定义成C语言的数据类型。

python,ctypes , c 对应类型参考 python 官方文档:https://docs.python.org/3.5/library/ctypes.html

这里列举几个常用的数据类型

ctypes type(ctypes类型)

C type(c语言类型)

Python type(python类型)

c_bool

_Bool

bool (1)

c_char

char

1-character bytes object

c_wchar

wchar_t

1-character string

c_byte

char

int

c_char_p

char * (NUL terminated)

1-character bytes object

c_wchar_p

wchar_t * (NUL terminated)

string or None

 

比如创建一个带参数的go函数:

// 指定接收的参数为c类型的字符串,返回c类型字符串
//pxport addstr
func addstr(a,b * C.char) *C.char{
        merge := C.GoString(a) + C.GoString(b)
        return C.CString(merge)

}

  

写好go代码之后重新生成动态链接库

go build -buildmode=c-shared -o hello.so src/hello.go

在python中调用带参数的go模块需要显式指定参数的类型以及返回的数据类型。argtypes指定参数类型,restype

指定返回值类型。

from ctypes import CDLL
add = CDLL('./hello.so').addstr  #调用go模块
# 显式声明参数和返回的期望类型
add.argtypes = [ctypes.c_char_p, ctypes.c_char_p]
add.restype = ctypes.c_char_p
print(add('haha','hehe'))

# 无参数,则可直接调用
t = CDLL('./hello.so').test #调用go模块
print(t())

  

python 中调用go模块,并统计两个模块循环1百万次累加的时间,查看go跟python执行效率

# coding=utf-8
import time
from ctypes import CDLL
import ctypes

def xu():
    # python 计算累加
    sum = 0
    for i in range(0,1000000+1):
        sum += i
    return sum

if __name__ =="__main__":


    add = CDLL('./hello.so').addstr  #调用go模块addstr方法
    # 显式声明参数和返回的期望类型
    add.argtypes = [ctypes.c_char_p, ctypes.c_char_p]
    add.restype = ctypes.c_char_p

    print(add('haha','hehe'))

    # go 一百万次累加
    start  = time.time()
    t = CDLL('./hello.so').test #调用go模块test方法
    t.restype = ctypes.c_int64    # 返回int64类型
    print("go执行结果:%s"%t())
    end = time.time()
    print("go :1000000 累加耗时 %.2f" %(end-start))

    # python累加一百万次 
    start  = time.time()
    print("python执行结果:%s"%xu())
    end = time.time()
    print("python :1000000 累加耗时 %.2f" %(end-start))

  

单从循环一百万次来看,go的效率要高很多。

 

Python 号称开发速度快,而go语言在静态语言中也号称是开发开发速度最快的,go的高并发刚好可以填补Python GIL导致Python多线程不是真的多线程这一缺点。

本文主要讲解了如何使用golang写Python模块,以及在Python中如何调用go模块,主要要注意的是参数类型的转换。