05web安全学习---PHP正则表达式_web安全

一、初识SQL注入

05web安全学习---PHP正则表达式_php_02

<meta charset='GBK' />
<form><center>
	用户登录<br />
  账号: <input type='text' name='uname' /><br />
  密码: <input type='password' name='pwd'/><br />
  <input type='submit' value='登录'>
</form></center>
<?php
@$username = $_REQUEST['uname'];
@$password = $_REQUEST['pwd'];
if(@$_REQUEST['uname'] != '' and @$_REQUEST['pwd'] != ''){  
	$conn = mysqli_connect('127.0.0.1', 'root', 'root', 'test'); //数据库的连接
	$sql = 'select * from admin where username="'.$username.'" and password ="'.$password.'"';
	$safelogin = $username.$password;
	if(strstr($safelogin, 'or')){die('Illegal attack');}
	$b = mysqli_query($conn, $sql); //sql语句的执行
	$result = mysqli_fetch_array($b); //将数据库里的对象变为数组
  echo "你的密码是: ".$result['password'];  //获取数据
}else{echo '账户密码错误';}  
?>

二、什么是正则表达式

05web安全学习---PHP正则表达式_php_03

三、PHP中正则表达式常用函数

05web安全学习---PHP正则表达式_php_04

preg_match_all(, , );
preg_replace(, , );

05web安全学习---PHP正则表达式_web安全_05


05web安全学习---PHP正则表达式_数学建模_06

结果为:

05web安全学习---PHP正则表达式_数学建模_07


四、正则表达式语法

正则表达式的语法-字符(1):

05web安全学习---PHP正则表达式_数学建模_08

05web安全学习---PHP正则表达式_学习_09

正则表达式的语法-字符(2):

05web安全学习---PHP正则表达式_web安全_10

05web安全学习---PHP正则表达式_学习_11

05web安全学习---PHP正则表达式_学习_12

正则表达式的语法-关键字 :

05web安全学习---PHP正则表达式_安全_13

05web安全学习---PHP正则表达式_安全_14

正则表达式的语法-限定符 + 修饰符 :

05web安全学习---PHP正则表达式_web安全_15

05web安全学习---PHP正则表达式_php_16

05web安全学习---PHP正则表达式_数学建模_17


05web安全学习---PHP正则表达式_web安全_18

05web安全学习---PHP正则表达式_学习_19

05web安全学习---PHP正则表达式_php_20

补充知识点:

1、什么是SQL注入?
把用户输入的数据当做SQL代码执行。

2、什么是正则表达式?
正则表达式又称规则表达式,在代码中常简写为regex、regexp或RE,正则表达式通常被用来检索、替换那些符合某个模式的文本。

3、正则表达式的格式?
"/表达式/[修饰符]"。

4、正则表达式的用途是什么?
(1)判断字符串是否符合某一规则(比如判断是否符合手机号、邮箱规则等等)
(2)从一个字符串中找出符合规则的所有子字符串(比如取HTML标签名等等)

5、当使用正则表达式时要注意什么?
在php中使用正则表达式时一定要写标识符//( /表达式/ )

5、php中正则表达式常用相关函数是什么?
Preg_match_all(正则表达式、匹配字符串、匹配到的东西放入数组)
该函数会返回匹配到的次数(可能是0),或者如果发生错误返回FALSE
preg_replace(正则表达式、替换成什么、匹配字符串)说
该函数会返回替换后的结果

6、正则表达式的语法——字符(一)
数字:\d
非数字:\D
空白字符(空格、制表符、换页符等):\s
非空白字符:\S
单词字符(26个英文字母+数字+下划线):\w
非单词字符:\W

7、正则表达式的语法——字符(二)
字符集合:[单个字符或字符区间],用于匹配集合内字符
比如:
[a-z]表示a-z这26个小写字母
[0-9a-z]表示0-9这10个数字和a-z这26个小写字母
[123a-h]表示包含数字1,2,3和a-h这8个字母
注意:两个不同的字符段间一定不要用逗号隔开
非集合字符:[^单个字符或字符区间],用于匹配非集合内字符
比如:
[^0-9]表示匹配所有非数字字符
[^a-zA-Z]表示匹配所有非字母字符

8、字符集合的数字区间该注意什么?
数字区间正则只能匹配0-9的数字,因为正则只能一位一位的匹配,所以超过9以外的数字只是我们给的概念,对于正则机制来说它是认不到的,比如[100-120]就无法被匹配

9、正则表达式的语法——关键字
() 表示一个整体
^ 匹配输入字符串的开始位置
$ 匹配输入字符串的结尾位置
. 通配符,代表任意字符但不匹配换行
* 匹配0次或者多次
+ 匹配1次或者多次
\ 转义字符
| 两项之间的一个选择

10、转义字符“\”的使用
转义字符主要是将一些特殊字符转为普通字符。而这些常用特殊字符有”.”、”?”、”\”等。

11、^和$结合使用的注意问题?
如果^和$结合使用且中间没有其他表达式,那么他们中间就不能出现别的字符,不然无法匹配,比如/^3b$/表示3开头b结尾,所以只有3b才能被匹配,如果写了3acb就无法被匹配。什么情况下才能被匹配呢,可以使用.(通配符)。

12、非集合字符的“^”和关键字“^”的区别?
非集合字符的“^”可理解为排除字符,排除操作,一般放在[]中,如[^1-5], 表示该字符不是1-5之间的数字;而关键字的“^”表示行开始,如"^ab"表示以ab开头的字符串。

13、正则表达式的语法——限定符
{n} 例如0{8} 表示只有连起来8个0才会被匹配
{n,} 例如0{2,} 表示只要2个0及其以上的就会被匹配
{n,m} 例如0{2,4} 表示最少匹配2个0,最多匹配4个0
注:被匹配时,默认匹配最多的次数

14、正则表达式的语法——修饰符
i 表示不区分大小写
A 匹配规则必须从头开始匹配
s 表示.将匹配一切字符
x 表示正则表达式中的空白字符会被忽略
e 代码执行仅限preg_replace()

15、匹配模式的优先级是什么?(优先级从高到低排)
\转义字符;()[]大原子和原子表;*+?{n}{n,}{n,m}重复匹配(匹配次数);^$\b\B边界限制;|模式选择

正则实例:

验证数字的正则表达式集 
验证数字:^[0-9]*$
验证n位的数字:^\d{n}$
验证至少n位数字:^\d{n,}$
验证m-n位的数字:^\d{m,n}$
验证零和非零开头的数字:^(0|[1-9][0-9]*)$
验证有两位小数的正实数:^[0-9]+(.[0-9]{2})?$
验证有1-3位小数的正实数:^[0-9]+(.[0-9]{1,3})?$
验证非零的正整数:^\+?[1-9][0-9]*$
验证非零的负整数:^\-[1-9][0-9]*$
验证非负整数(正整数 + 0)  ^\d+$
验证非正整数(负整数 + 0)  ^((-\d+)|(0+))$
验证长度为3的字符:^.{3}$
验证由26个英文字母组成的字符串:^[A-Za-z]+$
验证由26个大写英文字母组成的字符串:^[A-Z]+$
验证由26个小写英文字母组成的字符串:^[a-z]+$
验证由数字和26个英文字母组成的字符串:^[A-Za-z0-9]+$
验证由数字、26个英文字母或者下划线组成的字符串:^\w+$
验证用户密码:^[a-zA-Z]\w{5,17}$ 正确格式为:以字母开头,长度在6-18之间,只能包含字符、数字和下划线。
验证是否含有 ^%&',;=?$\" 等字符:[^%&',;=?$\x22]+
验证汉字:^[\u4e00-\u9fa5],{0,}$
验证Email地址:^\w+[-+.]\w+)*@\w+([-.]\w+)*\.\w+([-.]\w+)*$
验证InternetURL:^http://([\w-]+\.)+[\w-]+(/[\w-./?%&=]*)?$ ;^[a-zA-z]+://(w+(-w+)*)(.(w+(-w+)*))*(?S*)?$
验证电话号码:^(\(\d{3,4}\)|\d{3,4}-)?\d{7,8}$:--正确格式为:XXXX-XXXXXXX,XXXX-XXXXXXXX,XXX-XXXXXXX,XXX-XXXXXXXX,XXXXXXX,XXXXXXXX。
验证身份证号(15位或18位数字):^\d{15}|\d{}18$
验证一年的12个月:^(0?[1-9]|1[0-2])$ 正确格式为:“01”-“09”和“1”“12”
验证一个月的31天:^((0?[1-9])|((1|2)[0-9])|30|31)$    正确格式为:01、09和1、31。
整数:^-?\d+$
非负浮点数(正浮点数 + 0):^\d+(\.\d+)?$
正浮点数   ^(([0-9]+\.[0-9]*[1-9][0-9]*)|([0-9]*[1-9][0-9]*\.[0-9]+)|([0-9]*[1-9][0-9]*))$
非正浮点数(负浮点数 + 0) ^((-\d+(\.\d+)?)|(0+(\.0+)?))$
负浮点数  ^(-(([0-9]+\.[0-9]*[1-9][0-9]*)|([0-9]*[1-9][0-9]*\.[0-9]+)|([0-9]*[1-9][0-9]*)))$
浮点数  ^(-?\d+)(\.\d+)?