php安全代码审计和缺陷设计_PHP

本文详细解释了PHP中等值比较和全等比较的区别,指出MD5比对漏洞,强调了在处理敏感数据时使用全等比较的重要性,并介绍了intval、strpos、in_array、preg_match和str_replace等函数的用法和注意事项。


==和===

==(等值比较)
当使用 == 操作符时,PHP将进行宽松比较,也就是说,只比较两个值的等价性,而不考虑它们的类型。

如果两个值类型不同,PHP会尝试将它们转换成相同的类型,然后再进行比较。

例如,字符串 “100” 和整数 100 使用 == 比较时结果为 true,因为字符串 “100” 在比较时会被转换成整数 100。

if ("100" == 100) { // true,因为值相等
    echo "等值";
}

===(全等比较)
使用 === 操作符时,PHP将进行严格比较,这意味着它不仅比较两个值的等价性,还会比较它们的类型。

只有当两个值的类型相同,且值也相等时,比较结果才为 true。

使用上面的例子,字符串 “100” 和整数 100 使用 === 比较时结果为 false,因为尽管它们的值相等,但类型不同。

if ("100" === 100) { // false,因为类型不相同
    echo "全等";
}

MD5

PHP中MD5比对漏洞通常与==(等值比较)操作符的使用有关。这种漏洞源于PHP在使用==进行字符串比较时,如果两个比较的字符串都是以0e开头,后跟纯数字,PHP会将它们视为科学记数法表示的数值零。因此,即使两个字符串实际上是不同的,它们也会被认为是相等的。

漏洞示例

$hash1 = md5('240610708');
$hash2 = md5('QNKCDZO');

if ($hash1 == $hash2) {
    echo '两个不同的字符串产生的MD5值被认为是相等的。';
}

md5(‘240610708’) 的结果是 0e462097431906509019562988736854,
md5(‘QNKCDZO’) 的结果是 0e830400451993494058024219903391。

由于这两个MD5值都以0e开头,后面跟随的都是数字,根据PHP的等值比较规则,这两个MD5值被认为是相等的,即使它们实际上是不同的字符串的结果。

安全建议
为避免这种安全漏洞,推荐使用全等比较操作符 ===,因为全等比较会认为这两个MD5值不相等

当涉及到敏感数据比对(如密码哈希值)时,应始终使用全等比较操作符 ===,以确保既比较值也比较值的类型,从而避免潜在的安全风险。

PHP中关于数组使用md5函数可能遇到的“漏洞”或不当行为,主要是由于md5函数对非字符串参数的处理方式引起的。由于 PHP 的 md5 函数不直接支持数组类型,尝试对任何数组使用 md5 函数将导致 PHP 内部将数组转换为字符串 “Array”,然后对该字符串计算 MD5 值。因此,不管数组的内容或数组变量的名称如何,只要传递的是数组,md5 函数都会返回对字符串 “Array” 的 MD5 哈希值,这意味着所有不同的数组都会返回相同的 MD5 值。

行为示例

$hash = md5(array('key' => 'value'));
echo $hash;

上述代码会产生类似以下的警告:

vbnet
Copy code
Warning: md5() expects parameter 1 to be string, array given in ...

并且md5函数会返回对字符串"Array"的MD5哈希值,而不是输入数组的哈希值。这意味着,无论数组的内容如何,对任何数组使用md5都会返回相同的结果,即:

echo md5("Array"); // 产生固定的输出

intval函数

PHP的intval()函数用于获取变量的整数值。这个函数可以将字符串、浮点数或布尔值转换成整数。当处理数值转换时,intval()是一个非常有用的函数。

基本语法如下:

intval(mixed $value, int $base = 10): int
$value:要转换的值。它可以是字符串、浮点数、布尔值,或者任何你想转换为整数的值。
$base:转换的基数(进制)。默认是10进制。这个参数对于字符串转换特别有用,因为它允许你指定字符串表示的数值的基数。有效的基数范围是2到36。
字符串转整数:
echo intval("42"); // 输出: 42

浮点数转整数:
echo intval(42.7); // 输出: 42

布尔值转整数:
echo intval(true); // 输出: 1
echo intval(false); // 输出: 0

带基数的字符串转整数:
echo intval('1e', 16); // 输出: 30,因为 '1e' 在16进制下等于十进制的30

注意事项

  • 转换规则:如果$value是字符串,则会根据字符串的起始部分尝试转换成整数。如果字符串起始部分不是数字或符号(+/-),intval()将返回0。
  • 浮点数转换:转换浮点数时,intval()会将浮点数向下取整到最接近的整数值。
  • 布尔值转换:布尔值true会被转换为1,false会被转换为0。
  • 基数的使用:当处理字符串转换时,$base参数允许你指定字符串是哪个基数(进制)下的数值,这对于处理不同进制的数值字符串特别有用。

strpos函数

在PHP中,strpos() 函数用于查找字符串内首次出现的另一字符串的位置。如果找到了字符串,则返回首次出现的位置的索引(注意,索引从0开始)。如果没有找到,则返回 FALSE。

strpos(string $haystack, mixed $needle, int $offset = 0): int|false
$haystack:需要搜索的字符串。
$needle:要查找的字符串值。如果 needle 不是一个字符串,它将被转换为整型并视为字符的顺序值。
$offset:可选参数,指定从哪个字符位置开始搜索。默认值为0。
$position = strpos("Hello world", "world");
echo $position; // 输出: 6

//在这个例子中,"world" 在 "Hello world" 中首次出现的位置是索引6(H=0, e=1, l=2, l=3, o=4, 空格=5, w=6)。

//未找到字符串:
$position = strpos("Hello world", "php");
if ($position === false) {
    echo "字符串未找到";
} else {
    echo "字符串位于位置: $position";
}

//在这个例子中,由于 "php" 没有在 "Hello world" 中出现,所以 strpos() 返回 false。

//使用偏移量:
$position = strpos("This is a test", "is", 3);
echo $position; // 输出: 5

//这里,搜索从索引3("s"的位置)开始,所以找到的 "is" 是在索引5的位置,而不是字符串开头处的 "is"。

注意事项
严格比较:当 strpos() 返回0时,表示找到的字符串位于 $haystack 的开始位置。因为0在PHP中是一个有效的位置索引,但它在布尔上下文中被视为 false。因此,比较 strpos() 的结果时,应使用全等(=== 或 !==)比较,以准确区分返回的0和 false。

in_array函数

PHP中的in_array()函数用于检查数组中是否存在某个值。如果指定的值存在于数组中,则函数返回true;否则,返回false。这个函数在需要判断一个项是否已经包含在数组中时非常有用,比如在处理表单输入或验证数据时。

in_array(mixed $needle, array $haystack, bool $strict = false): bool
$needle:需要搜索的值。
$haystack:被搜索的数组。
$strict:这是一个可选参数,如果设置为true,则in_array()还会检查$needle与找到的元素的类型是否完全相同。
$array = array("Apple", "Orange", "Banana");

if (in_array("Apple", $array)) {
    echo "找到了Apple。";
} else {
    echo "没有找到Apple。";
}

//使用严格模式:
$array = array(1, 2, "3", 4);

if (in_array("3", $array, true)) {
    echo "严格模式:找到了字符串'3'。";
} else {
    echo "严格模式:没有找到字符串'3'。";
}

if (in_array(3, $array, true)) {
    echo "严格模式:找到了数字3。";
} else {
    echo "严格模式:没有找到数字3。";
}

在这个例子中,第一次in_array调用未找到"3",因为启用了严格模式,而数组中的"3"是字符串类型,与搜索的数字类型不匹配。第二次调用同样没有找到数字3,因为虽然数组中确实有一个值为3的字符串,但严格模式要求类型也必须匹配

注意事项
在不使用严格模式(默认情况)时,in_array()只比较值,不比较类型。这意味着数字1和字符串"1"会被视为相等。
在使用严格模式(将$strict参数设置为true)时,in_array()会同时比较值和类型,提高了比较的准确性。

preg_match函数

这是PHP中用于执行正则表达式匹配的函数。preg_match()函数会执行一个正则表达式匹配测试,如果模式匹配成功,则返回1;如果失败,则返回0;如果发生错误,则返回FALSE。

preg_match(string $pattern, string $subject, array &$matches = null, int $flags = 0, int $offset = 0)
$pattern:要搜索的模式,即正则表达式。正则表达式字符串需要被定界符包围,如/pattern/。
$subject:输入字符串,即需要进行正则表达式匹配的文本。
$matches:(可选)如果提供,它将被填充为搜索结果。$matches[0]将包含完整模式匹配到的文本,$matches[1]将包含第一个括号内的子模式匹配到的文本,依此类推。
$flags:(可选)可以用来控制匹配的各种选项。
$offset:(可选)从目标字符串的哪个位置开始搜索(以字节为单位)。
$subject = "This is a test";
$pattern = "/is/";

if (preg_match($pattern, $subject, $matches)) {
    echo "匹配成功。\n";
    print_r($matches);
} else {
    echo "匹配失败。";
}

str_replace函数

PHP中的str_replace()函数用于替换字符串中的一些字符或子字符串。这个函数非常灵活,可以处理简单的字符替换,也能进行批量的子字符串替换,并且可以在数组中搜索和替换。

str_replace(mixed $search, mixed $replace, mixed $subject, int &$count = null): mixed
$search:要查找的字符串(或字符串数组)。这是你想要在$subject中被替换掉的部分。
$replace:用于替换的字符串(或字符串数组)。这是替换$search找到的内容的部分。
$subject:输入字符串(或字符串数组)。这是被搜索和替换的原文本。
$count:(可选)一个变量,用于统计进行替换的次数。
//返回替换后的字符串或数组。如果$subject是数组,那么str_replace()返回一个数组;如果$subject是字符串,返回一个字符串。

echo str_replace("world", "PHP", "Hello world"); // 输出:Hello PHP,默认只替换一次

//数组替换:
$find = array('apple', 'banana');
$replace = array('orange', 'grape');
$subject = 'I love apple and banana.';

echo str_replace($find, $replace, $subject); // 输出:I love orange and grape.

//统计替换次数:
$count = 0;
str_replace('apple', 'orange', 'apple pie, apple juice, and apples', $count);
echo $count; // 输出:3

注意事项
如果$search和$replace都是数组,则它们的键值一一对应,即每个$search的值将被对应$replace的值替换。
如果$replace的元素少于$search的元素,多出的$search将用空字符串进行替换。
如果$subject是数组,则$search和$replace的处理会应用于数组的每一个元素。
str_replace()是大小写敏感的。如果需要进行大小写不敏感的替换,请使用str_ireplace()函数。

例题1

include("flag.php");
highlight_file(__FILE__);
if(isset($_GET['num'])){
	$num=$_GET ['num’];
	if(preg_match(”f [0-9]/”,$num)){
		die("no no no! ");
	}
	if (intval ($num) ){
		echo$flag;
	}
}

payload:url + ?num[] = 1

解析:$num是一个数组,这导致preg_match()直接返回false,并且不会执行die(“no no no!”),因为preg_match()期望的是字符串,而这里提供的是数组。当对数组应用intval()函数时,PHP会将数组转换为整数。在PHP中,将数组转换成整数通常结果为0。

综上,该代码片段试图通过正则表达式来限制输入值必须为数字,并通过intval()来确保这个值在经过类型转换后仍然为真(即非零)。然而,由于$_GET[‘num’]可以通过num[] = 1变为数组,从而绕过了正则表达式检查。

例题2

include ("flag. php");
highlight_file(__FILE__);
if(isset ($_GET ['num'])){
	$num =$_GET['num'];
	if($num==="4476"){
		die("no no no! ");
	}
	if(intval ($num, 0)===4476){
		echo $flag;
	}else {
		echo intval ($num, 0);
	}
}

payload: url + ?num = 010574

解析:使用intval()函数时,如果指定第二个参数(基数)为0,那么intval()函数会根据字符串的格式自动判断数值的基数。特别是,如果字符串以"0"开头,PHP会将这个字符串当作八进制数来处理。
因此,当传递num=010574时,intval($num)会将010574解释为一个八进制数,转换成十进制是4476。由于$num(字符串"010574")不严格等于(===)字符串"4476",因此不会执行die(“no no no!”);语句。在接下来的if语句中,intval($num)的结果确实等于4476(十进制),因此满足条件,执行echo $flag;,展示了$flag的内容。

例题3

show_source(__FILE__);
include('flag.php');
$a = $_GET['cmd'];
if (preg_match('/^php$/im', $a)) {
    if (preg_match('/^php$/i', $a)) {
        echo 'hacker';
    } else {
        echo $flag;
    }
} else {
    echo 'nonononono';
}

payload: url + ?cmd = %0aphp

解析:%0a是URL编码形式的换行符(\n)。由于第一个preg_match使用了多行(m)模式,它将允许正则表达式匹配字符串中的任何位置(由于换行符的存在),使得$a匹配成功。换句话说,尽管$a的值以换行符开始,它仍然满足正则表达式的条件。第二个preg_match没有使用多行模式,因此理论上不会匹配以换行符开始的字符串\nphp,这导致执行流进入else分支,打印出$flag。