1.1 介绍
福哥在用Python去读PHP语言开发的项目的数据库的时候,发现一些字段里存储的居然是经过PHP的serialize函数序列化过的数据,这个要解开它通过json库是不行的了,怎么办呢?
原来Python专门有个库用来模拟PHP语言的serialize和unserialize的功能,它就是phpserialize库。
2. 安装phpserialize库可以直接通过pip进行安装。
pip3 install phpserialize
3. 使用 3.1 序列化
使用phpserialize库序列化一个结构转化为一个字符串用到的是dumps方法,用法和json库类似,区别是编码参数不是encoding是charset。
user = { \\\'id\\\': 35, \\\'name\\\': "福哥", \\\'abilities\\\': [ "PHP", "Java", "Python", "Javascript", "C/C++", "Asp.net" ]}print("原始数据:")print(user)print("序列化数据:")userSN = phpserialize.dumps(user, charset="utf-8")print(userSN)
可以看到序列化的结果和PHP的serialize基本一致。因为福哥设置的编码的UTF-8的,所以“福哥”占用了6个字符。
4. 反序列化使用phpserialize库反序列化一个序列化字符串得到原始数据结构用的是loads方法,用法和json库基本一样,同样编码参数也是charset而不是我们想象的encoding。
userSN = b"a:3:{s:2:"id";i:35;s:4:"name";s:6:"xe7xa6x8fxe5x93xa5";s:9:"abilities";a:6:{i:0;s:3:"PHP";i:1;s:4:"Java";i:2;s:6:"Python";i:3;s:10:"Javascript";i:4;s:5:"C/C++";i:5;s:7:"Asp.net";}}"print("序列化数据:")print(userSN)print("原始数据:")user = phpserialize.loads(userSN, charset="utf-8")print(user)
反序列化的时候最好也加上编码参数,避免以默认编码反序列化出现错误的情况。
5. 总结福哥今天带着童鞋们学习了Python的phpserialize库的使用方法,通过phpserialize库可以让Python语言拥有解析PHP的序列化数据的能力。