理解php Hash函数，增强密码安全

日期：2020-10-31 栏目：程序人生浏览：次

1.声明
密码学是一个复杂的话题，我也不是这方面的专家。许多高校和研究机构在这方面都有长期的研究。在这篇文章里，我希望尽量使用简单易懂的方式向你展示一种安全存储Web程序密码的方法。
2.“Hash”是做什么的？
“Hash将一段数据（小数据或大数据）转换成一段相对短小的数据，如字符串或整数。”
这是依靠单向hash函数来完成的。所谓单向是指很难（或者是实际上不可能）将其反转回来。一个常见的hash函数的例子是md5()，它流行于各种计算机语言和系统。

复制代码代码如下:

$data = "Hello World";
$hash = md5($data);
echo $hash; // b10a8db164e0754105b7a99be72e3fe5

使用md5()运算出来的结果总是32个字符的字符串，不过它只包含16进制的字符，从技术上来说它也可以用128位（16字节）的整形数来表示。你可以使用md5()来处理很长的字符串和数据，但是你始终得到的是一个固定长度的hash值，这也可能可以帮助你理解为什么这个函数是“单向”的。
3.使用Hash函数来存储密码
典型的用户注册过程：
用户填写注册表单，其中包含密码字段；
程序将所有用户填写的信息存储到数据库中；
然而密码在存储到数据库前通过hash函数加密处理；
原始的密码不再存储在任何地方，或者说它被丢弃了。
用户登录过程：
用户输入用户名和密码；
程序将密码通过以注册相同的hash函数进行加密；
程序从数据库查到用户，并读取hash后的密码；
程序比较用户名和密码，如果匹配则给用户授权。
如何选择合适的方法来加密密码，我们将在文章的后面讨论这个问题。
4.问题1：hash碰撞
hash碰撞是指对两个不同的内容进行hash得到了相同的hash值。发生hash碰撞的可能性取决于所用的hash算法。
如何产生？
举个例子，一些老式程序使用crc32()来hash密码，这种算法产生一个32位的整数作为hash结果，这意味着只有2^32 (即4,294,967,296) 种可能的输出结果。
让我们来hash一个密码：

复制代码代码如下:

echo crc32('supersecretpassword');
// outputs: 323322056

现在我们假设一个人窃取了数据库，得到了hash过的密码。他可能不能将323322056还原为‘supersecretpassword'，然而他可以找到另一个密码，也能被hash出同样的值。这只需要一个很简单的程序：

复制代码代码如下:

set_time_limit(0);
$i = 0;
while (true) {
if (crc32(base64_encode($i)) == 323322056) {
echo base64_encode($i);
exit;
}
$i++;
}

这个程序可能需要运行一段时间，但是最终它能返回一个字符串。我们可以使用这个字符串来代替‘supersecretpassword'，并使用它成功的登录使用该密码的用户帐户。
比如在我的电脑上运行上面的程序几个月后，我得到了一个字符串：‘MTIxMjY5MTAwNg=='。我们来测试一下：

复制代码代码如下:

echo crc32('supersecretpassword');
// outputs: 323322056
echo crc32('MTIxMjY5MTAwNg==');
// outputs: 323322056

如何解决？
现在一个稍强一点的家用PC机就可以一秒钟运行十亿次hash函数，所以我们需要一个能产生更大范围的结果的hash函数。比如md5()就更合适一些，它可以产生128位的hash值，也就是有340,282,366,920,938,463,463,374,607,431,768,211,456种可能的输出。所以人们一般不可能做那么多次循环来找到hash碰撞。然而仍然有人找到方法来做这件事情，详细可以查看例子。
sha1()是一个更好的替代方案，因为它产生长达160位的hash值。
5.问题2：彩虹表
即使我们解决了碰撞问题，还是不够安全。
“彩虹表通过计算常用的词及它们的组合的hash值建立起来的表。”
这个表可能存储了几百万甚至十亿条数据。现在存储已经非常的便宜，所以可以建立非常大的彩虹表。
现在我们假设一个人窃取了数据库，得到了几百万个hash过的密码。窃取者可以很容易地一个一个地在彩虹表中查找这些hash值，并得到原始密码。虽然不是所有的hash值都能在彩虹表中找到，但是肯定会有能找到的。
如何解决？
我们可以尝试给密码加点干扰，比如下面的例子：

复制代码代码如下:

$password = "easypassword";
// this may be found in a rainbow table
// because the password contains 2 common words
echo sha1($password); // 6c94d3b42518febd4ad747801d50a8972022f956
// use bunch of random characters, and it can be longer than this
$salt = "f#@V)Hu^%Hgfds";
// this will NOT be found in any pre-built rainbow table
echo sha1($salt . $password); // cd56a16759623378628c0d9336af69b74d9d71a5

在这里我们所做的只是在每个密码前附加上一个干扰字符串后进行hash，只要附加的字符串足够复杂，hash后的值肯定是在预建的彩虹表中找不到的。不过现在还是不够安全。
6.问题3：还是彩虹表
注意，彩虹表可能在窃取到干拢字符串后重头开始建立。干扰字符串一样也可能被和数据库一起被窃取，然后他们可以利用这个干扰字符串从头开始创建彩虹表，如“easypassword”的hash值可能在普通的彩虹表中存在，但是在新建的彩虹表里，“f#@V)Hu^%Hgfdseasypassword”的hash值也会存在。
如何解决？
我们可以对每个用户使用唯一的干扰字符串。一个可用的方案就是使用用户在数据库中的id：

复制代码代码如下:

转载注明出处：http://www.heiqu.com/af2d4ee441cac120db7a221c2733a3e8.html

理解php Hash函数，增强密码安全

相关推荐