在区块链上,用户通过运行部署在区块链上的合约,完成需要共识的操作。
以太坊虚拟机,是智能合约代码的执行器。
当智能合约被编译成二进制文件后,被部署到区块链上。
用户通过调用智能合约的接口,来触发智能合约的执行操作。
EVM执行智能合约的代码,修改当前区块链上的数据(状态)。
被修改的数据,会被共识,确保一致性。
EVMC – Ethereum Client-VM Connector API
新版本的以太坊将EVM从节点代码中剥离出来,形成一个独立的模块。EVM与节点的交互,抽象出EVMC接口标准。
通过EVMC,节点可以对接多种虚拟机,而不仅限于传统的基于solidity的虚拟机。
传统的solidity虚拟机,在以太坊中称为interpreter,下文主要解释interpreter的实现。
EVMC 接口
EVMC主要定义了两种调用的接口:
- Instance接口:节点调用EVM的接口
- Callback接口:EVM回调节点的接口
EVM本身不保存状态数据,节点通过instance接口操作EVM,EVM反过来,调Callback接口,对节点的状态进行操作。
Instance 接口
定义了节点对虚拟机的操作,包括创建,销毁,设置等。
接口定义在evmc_instance(evmc.h)中
- abi_version
- name
- version
- destroy
- execute
- set_tracer
- set_option
Callback接口
定义了EVM对节点的操作,主要是对state读写、区块信息的读写等。
接口定义在evmc_context_fn_table(evmc.h)中。
- evmc_account_exists_fn account_exists
- evmc_get_storage_fn get_storage
- evmc_set_storage_fn set_storage
- evmc_get_balance_fn get_balance
- evmc_get_code_size_fn get_code_size
- evmc_get_code_hash_fn get_code_hash
- evmc_copy_code_fn copy_code
- evmc_selfdestruct_fn selfdestruct
- evmc_call_fn call
- evmc_get_tx_context_fn get_tx_context
- evmc_get_block_hash_fn get_block_hash
- evmc_emit_log_fn emit_log
EVM 执行
EVM 指令
solidity是合约的执行语言,solidity被solc编译后,变成类似于汇编的EVM指令。
Interpreter定义了一套完整的指令集。solidity被编译后,生成二进制文件,二进制文件就是EVM指令的集合,交易以二进制的形式发往节点,节点收到后,通过EVMC调用EVM执行这些指令。
在EVM中,用代码模拟实现了这些指令的逻辑。
Solidity是基于堆栈的语言,EVM在执行二进制时,也是以堆栈的方式进行调用。
算术指令举例
一条ADD指令,在EVM中的代码实现如下。
SP是堆栈的指针,从栈顶第一和第二个位置(SP[0]、SP[1])拿出数据,进行加和后,写入结果堆栈SPP的顶端SPP[0]。
CASE(ADD) { ON_OP(); updateIOGas(); // pops two items and pushes their sum mod 2^256. m_SPP[0] = m_SP[0] + m_SP[1]; }
跳转指令举例
JUMP指令,实现了二进制代码间的跳转。首先从堆栈顶端SP[0]取出待跳转的地址,验证一下是否越界,放到程序计数器PC中,下一个指令,将从PC指向的位置开始执行。
CASE(JUMP) { ON_OP(); updateIOGas(); m_PC = verifyJumpDest(m_SP[0]); }
状态读指令举例
SLOAD可以查询状态数据。大致过程是,
- 从堆栈顶端SP[0]取出要访问的key,
- 把key作为参数,然后调evmc的callback函数get_storage() ,查询相应的key对应的value。
- 之后将读到的value写到结果堆栈SPP的顶端SPP[0]。
CASE(SLOAD) { m_runGas = m_rev >= EVMC_TANGERINE_WHISTLE ? 200 : 50; ON_OP(); updateIOGas(); evmc_uint256be key = toEvmC(m_SP[0]); evmc_uint256be value; m_context->fn_table->get_storage(&value, m_context, &m_message->destination, &key); m_SPP[0] = fromEvmC(value); }
状态写指令举例
SSTORE指令可以将数据写到节点的状态中,大致过程是,从栈顶第一和第二个位置(SP[0]、SP[1])拿出key和value,把key和value作为参数,调用evmc的callback函数set_storage() ,写入节点的状态。
CASE(SSTORE) { ON_OP(); if (m_message->flags & EVMC_STATIC) throwDisallowedStateChange(); static_assert( VMSchedule::sstoreResetGas <= VMSchedule::sstoreSetGas, "Wrong SSTORE gas costs"); m_runGas = VMSchedule::sstoreResetGas; // Charge the modification cost up front. updateIOGas(); evmc_uint256be key = toEvmC(m_SP[0]); evmc_uint256be value = toEvmC(m_SP[1]); auto status = m_context->fn_table->set_storage(m_context, &m_message->destination, &key, &value); if (status == EVMC_STORAGE_ADDED) { // Charge additional amount for added storage item. m_runGas = VMSchedule::sstoreSetGas - VMSchedule::sstoreResetGas; updateIOGas(); } }
合约调用指令举例
CALL指令能够根据地址调用另外一个合约。首先,EVM判断是CALL指令,调用caseCall()。
在caseCall()中,用caseCallSetup()从堆栈中拿出数据,封装成msg,作为参数,调用evmc的callback函数call。
Eth在被回调call()后,启动一个新的EVM,处理调用,之后将新的EVM的执行结果,通过call()```的参数返回给当前的EVM,当前的EVM将结果写入结果堆栈SSP中,调用结束。合约创建的逻辑与此逻辑类似。
CASE(CALL) CASE(CALLCODE) { ON_OP(); if (m_OP == Instruction::DELEGATECALL && m_rev < EVMC_HOMESTEAD) throwBadInstruction(); if (m_OP == Instruction::STATICCALL && m_rev < EVMC_BYZANTIUM) throwBadInstruction(); if (m_OP == Instruction::CALL && m_message->flags & EVMC_STATIC && m_SP[2] != 0) throwDisallowedStateChange(); m_bounce = &VM::caseCall; } BREAK void VM::caseCall() { m_bounce = &VM::interpretCases; evmc_message msg = {}; // Clear the return data buffer. This will not free the memory. m_returnData.clear(); bytesRef output; if (caseCallSetup(msg, output)) { evmc_result result; m_context->fn_table->call(&result, m_context, &msg); m_returnData.assign(result.output_data, result.output_data + result.output_size); bytesConstRef{&m_returnData}.copyTo(output); m_SPP[0] = result.status_code == EVMC_SUCCESS ? 1 : 0; m_io_gas += result.gas_left; if (result.release) result.release(&result); } else { m_SPP[0] = 0; m_io_gas += msg.gas; } ++m_PC; }
总结
EVM是一个状态执行的机器,输入是solidity编译后的二进制指令和节点的状态数据,输出是节点状态的改变。
以太坊通过EVMC实现了多种虚拟机的兼容。但截至目前,并未出现除开interpreter之外的,真正生产可用的虚拟机。也许要做到同一份代码在不同的虚拟机上跑出相同的结果,是一件很难的事情。