本文深入分析了Python面向对象程序设计OOP。分享给大家供大家参考,具体如下:下面是一个
本文深入分析了Python面向对象程序设计OOP。分享给大家供大家参考,具体如下:
下面是一个关于OOP的实例,模块文件为person.py
# File person.py(start)
class Person:
def __init__(self, name, job=None, pay=0):
self.name = name
self.job = job
self.pay = pay
def last_name(self):
return self.name.split()[-1]
def give_raise(self, percent):
self.pay = int(self.pay * (1+percent))
print('total percent:%f' % percent)
def __str__(self):
return '[Person: %s, %s]' % (self.name, self.pay)
class Manager(Person):
# 这是一种不太好的方法重载的方法,实际应用中我们采用下面的方法
def give_raise(self, percent, bonus=.1):
self.pay = int(self.pay * (1+percent+bonus))
# 这个方法利用了这样的一个事实:类方法总是可以在一个实例中调用。
# 其实常规的实例调用,也是转换为类的调用
# instance.method(args...) 由Python自动地转换为 class.method(instance,args...)
# 所以要记得直接通过类进行调用时,必须手动传递实例,这里就是self参数
# 而且不能写成self.give_raise,这样会导致循环调用
#
# 那么为什么采用这种形式呢?因为它对未来的代码的维护意义重大,因为give_raise现在
# 只在一个地方,即Person的方法,将来需要修改的时候,我们只需要修改一个版本
def give_raise(self, percent, bonus=.1):
Person.give_raise(self, percent+bonus)
if __name__ == '__main__':
# self-test code
bob = Person('Bob Smith')
sue = Person('Sue Jones', job='dev', pay=100000)
print(bob)
print(sue)
print(bob.last_name(), sue.last_name())
sue.give_raise(.1)
print(sue)
print('-'*20)
tom = Manager('Tom Jones', 'mgr', 50000)
tom.give_raise(.1)
print(tom.last_name())
print(tom)
print('--All three--')
for obj in (bob, sue, tom):
obj.give_raise(.1)
print(obj)
这个示例定义了Person类,并且Person类的构造函数采用了默认关键字参数,重载了__str__方法用以print输出,定义了得到last_name的方法,定义了give_raise涨工资方法。类Manager继承自Person,Manager重新定义了自己的give_raise方法,获得额外的bonus=0.1的奖金。
在代码最后,写了自测试的代码if __name__ == '__main__'
,用以测试。输出如下:
[Person: Bob Smith, 0] [Person: Sue Jones, 100000] Smith Jones total percent:0.100000 [Person: Sue Jones, 110000] -------------------- total percent:0.200000 Jones [Person: Tom Jones, 60000] --All three-- total percent:0.100000 [Person: Bob Smith, 0] total percent:0.100000 [Person: Sue Jones, 121000] total percent:0.200000 [Person: Tom Jones, 72000]
这里也可以给Manager增加自己独有的方法。
定制构造函数
现在的代码可以正常工作,但是,如果仔细研究会发现,当我们创建Manager对象的时候,必须为它提供一个mgr工作名称似乎没有意义:这已经由类自身暗示了。
所以,为了改善这点,我们要重新定义Manager中的__init__
方法,从而提供mgr字符串,而且和give_raise的定制一样,通过类名的调用来运行Person中最初的__init__
。
def __init__(self, name, pay):
Person.__init__(self, name, 'mgr', pay)
那么之后的实例化就变成了:
tom = Manager('Tom Jones', 50000)
OOP比我们认为的简单
这是Python的OOP机制中几乎所有重要的概念:
- 实例创建——填充实例属性
- 行为方法——在类方法中封装逻辑
- 运算符重载——为打印这样的内置操作提供行为
- 定制行为——重新定义子类中的方法以使其特殊化
- 定制构造函数——为超类步骤添加初始化逻辑。
组合类的其他方式
有时候,我们可以以其他的方式组合类。例如,一种常用的编码模式是把对象彼此嵌套以组成复合对象,而不是继承。如下的替代方法使用__getattr__
运算符重载方法来拦截未定义属性的访问。这时候,我们的代码如下:
class Person:
...same...
class Manager():
def __init__(self, name, pay):
self.person = Person(name, 'mgr', pay)
def give_raise(self, percent, bonus=.1):
self.person.give_raise(percent+bonus)
def __getattr__(self, attr):
return getattr(self.person, attr)
def __str__(self):
return str(self.person)
if __name__ == '__main__':
...same...
实际上,这个Manager替代方案是一种叫做委托的常用代码模式的一个代表,委托是一种基于符合的结构,它管理一个包装的对象并且把方法调用传递给它。
这里Manager不是一个真正的Person,因此,我们必须增加额外的代码为嵌入的对象分派方法,比如像__str__
这样的运算符重载方法必须重新定义。所以它需要的代码量增加,对于这个例子来说,没有哪个明智的Python程序员会按照这种方式组织代码,但是,当嵌入的对象比直接定制隐藏需要与容器之间有更多有限的交互时,对象嵌入以及基于其上的设计模式还是很适合的。
下述代码假设Department可能聚合其他对象,以便将它们当做一个集合对待。
class Department:
def __init__(self, *args):
self.members = list(args)
def add_member(self, person):
self.members.append(person)
def give_raise(self, percent):
for person in self.members:
person.give_raise(percent)
def show_all(self):
for person in self.members:
print(person)
development = Department(bob,sue)
development.add_member(tom)
development.give_raise(.1)
development.show_all()
这里的代码使用了继承和复合——Department是嵌入并控制其他对象的聚合的一个复合体,但是,嵌入的Person和Manager对象自身使用继承来定制。作为另一个例子,一个GUI可能类似地使用继承来定制标签和按钮的行为或外观,但也会复合以构建嵌入的挂件(如输入表单、计算器和文本编辑器)的一个更大的包。
使用内省类工具
我们定制构造函数之后的Manager类还有几点小问题如下:
- 打印的时候,Manager会把他标记为Person。如果能够用最确切(也就是说最低层)的类来显示对象,这可能会更准确些。
- 其次,当前的显示格式只是显示了包含在
__str__
中的属性,而没有考虑未来的目标。例如,我们无法通过Manager的构造函数验证tom工作名已经正确地设置为mgr,因为我们为Person编写的__str__
没有打印出这一字段。更糟糕的是,如果我们改变了在__init__
中分配给对象的属性集合,那么还必须记得也要更新__str__
以显示新的名字,否则,将无法随着时间的推移而同步。
我们可以使用Python的内省工具来解决这两个问题,它们是特殊的属性和函数,允许我们访问对象实现的一些内部机制。例如,在我们的代码中,有两个钩子可以帮助我们解决问题:
- 内置的
instance.__class__
属性提供了一个从实例到创建它的类的链接。类反过来有一个__name__
,还有一个__bases__
序列,提供了超类的访问。我们使用这些来打印创建的一个实例的类的名字,而不是通过硬编码来做到。 - 内置的
object.__dict__
属性提供了一个字典,带有一个键/值对,以便每个属性都附加到一个命名空间对象(包括模块、类和实例)。由于它是字典,因此我们可以获取键的列表、按照键来索引、迭代其值等等。我们使用这些来打印出任何实例的每个属性,而不是在定制显示中硬编码。
下面是这些工具在交互模式下的实际使用情形:
>>> from person import Person
>>> bob = Person('Bob Smith')
>>> print(bob)
[Person: Bob Smith, 0]
>>> bob.__class__
<class 'person.Person'>
>>> bob.__class__.__name__
'Person'
>>> list(bob.__dict__.keys())
['name', 'pay', 'job']
>>> for key in bob.__dict__:
... print(key,'=>',bob.__dict__[key])
...
name => Bob Smith
pay => 0
job => None
>>> for key in bob.__dict__:
... print(key,'=>',getattr(bob,key))
...
name => Bob Smith
pay => 0
job => None
一种通用的显示工具
新打开一个文件,并编写如下代码:它是一个新的、独立的模块,名为classtools.py,仅仅实现了这样一个类。由于其__str__
,print重载用于通用的内省工具,它将会对任何实例有效,不管实例的属性集合是什么。并且由于这是一个类,所以它自动变成一个公用的工具:得益于继承,他可以混合到想要使用它显示格式的任何类中。作为额外的好处,如果我们想要改变实例的显示,只需要修改这个类即可。
# File classtools.py
"""Assorted class utilities and tools"""
class AttrDisplay:
"""
Provides an inheritable print overload method that displays
instances with their class names and a name-value pair for
each attribute stored on the instance itself(but not attrs
inherited from its classes).Can be mixed into any class,
and will work on any instance.
"""
def gatherAttrs(self):
attrs = []
for key in sorted(self.__dict__):
attrs.append('%s = %s' % (key,getattr(self,key)))
return ','.join(attrs)
def __str__(self):
return '[%s:%s]' % (self.__class__.__name__, self.gatherAttrs())
if __name__ == '__main__':
class TopTest(AttrDisplay):
count = 0
def __init__(self):
self.attr1 = TopTest.count
self.attr2 = TopTest.count + 1
TopTest.count += 2
class SubTest(TopTest):
pass
x, y = TopTest(), SubTest()
print(x)
print(y)
注意这里的文档字符串,作为通用的工具,我们需要添加一些功能来产生文档。
这里定义的__str__
显示了实例的类,及其所有的属性名和值,按照属性名排序。
[TopTest:attr1 = 0,attr2 = 1] [SubTest:attr1 = 2,attr2 = 3]
工具类的命名考虑
最后一点需要考虑的是,由于classtools模块中的AttrDisplayz类旨在和其他任意类混合的通用性工具,所以我们必须注意与客户类潜在的无意的命名冲突。如果一个子类无意地自己定义了一个gatherAttrs名称,它很可能会破坏我们的类。
为了减少这样的名称冲突的机会,Python程序员常常对于不想做其他用途的方法添加一个【单个下划线】的前缀,在我们这个例子中就是_gatherAttrs。这不是很可靠,如果一个子类也定义了_gatherAttrs,该如何是好?但是它通常已经够用了,并且对于类内部的方法,这是常用的Python命名惯例。
一种更好但是不太常用的方法是,只在方法名前面使用【两个下划线】符号,__gatherAttrs,Python自动扩展这样的名称,以包含类的名称,从而使它们变得真正唯一。这一功能通常叫做【伪私有类属性】,将在以后介绍。
首先要使用打印这一通用工具,所需要做的是从其模块中导入它,使用继承将其混合到顶层类中,并且删除我们之前编写的更专门的__str__
方法。新的打印重载方法将会由Person的实例继承,Manager的实例也会继承。
下面就是类的最终形式:
# File person.py(start)
from classtools import AttrDisplay
class Person(AttrDisplay):
"""
Create and process person records
"""
def __init__(self, name, job=None, pay=0):
self.name = name
self.job = job
self.pay = pay
def last_name(self):
return self.name.split()[-1]
def give_raise(self, percent):
self.pay = int(self.pay * (1+percent))
print('total percent:%f' % percent)
class Manager(Person):
"""
A customized Person with special requirements
"""
def __init__(self, name, pay):
Person.__init__(self, name, 'mgr', pay)
def give_raise(self, percent, bonus=.1):
Person.give_raise(self, percent+bonus)
if __name__ == '__main__':
# self-test code
bob = Person('Bob Smith')
sue = Person('Sue Jones', job='dev', pay=100000)
print(bob)
print(sue)
print(bob.last_name(), sue.last_name())
sue.give_raise(.1)
print(sue)
print('-'*20)
tom = Manager('Tom Jones', 50000)
tom.give_raise(.1)
print(tom.last_name())
print(tom)
在这个版本中,也添加了一些新的注释来记录所做的工作和每个最佳实践惯例——使用了功能性描述的文档字符串和用于简短注释的#。现在运行这段代码,将会看到对象的所有属性,并且最终的问题也解决了:由于AttrDisplay直接从self实例中提取了类名,所有每个对象都显示其最近的(最低的)类的名称——tom现在显示为Manager,而不是Person。
[Person:job = None,name = Bob Smith,pay = 0] [Person:job = dev,name = Sue Jones,pay = 100000] Smith Jones total percent:0.100000 [Person:job = dev,name = Sue Jones,pay = 110000] -------------------- total percent:0.200000 Jones [Manager:job = mgr,name = Tom Jones,pay = 60000]
这正是我们所追求的更有用的显示,我们属性显示类已经变成了一个【通用工具】,可以通过继承将其混合到任何类中,从而利用它所定义的显示格式。
最后:把对象存储到数据库中
我们创建的对象还不是真正的数据库记录,他们只是内存中的临时对象,而没有存储到文件这样更为持久的媒介中。所以,现在要使用Python的一项叫做【对象持久化】的功能把对象保存。
Pickle和Shelve
对象持久化通过3个标准的库模块来实现,这3个模块在Python中都可用:
- pickle:任意的Python对象和字节串之间的序列化
- dbm:实现一个可通过键访问的文件系统,以存储字符串
- shelve:使用另两个模块按照把Python对象存储在一个文件中。
在Shelve数据库中存储对象
让我们编写一个新的脚本,把类的对象存储到shelve中。在文本编辑器中,打开一个名为makedb.py的新文件,导入shelve模块,用一个外部文件名打开一个新的shelve,把对象赋给shelve中的键,当我们操作完毕之后关闭这个shelve,因为已经做了修改:
# File makedb.py:store Person objects on a shelve database
from person import Person, Manager
import shelve
bob = Person('Bob Smith')
sue = Person('Sue Jones', job='dev', pay='100000')
tom = Manager('Tom Jones', 50000)
db = shelve.open('persondb')
for obj in (bob, sue, tom):
db[obj.name] = obj
db.close()
注意,这里我们把对象的名字用作键,从而把他们赋给shelve,这么做只是为了方便,在shelve中,键可以是任何的字符串,唯一的规则是,键必须是字符串并且是唯一的。这样,我们就可以针对每个键只存储一个对象。然而,我们在键之下的值可以是几乎任何类型的Python对象:像字符串、列表和字典这样的内置对象,用户定义的类实例,以及所有这些嵌套式的组合。
运行这段代码,没有输出,意味着他可能有效。
交互式探索shelve
此时,当前的目录下会有一个或多个真实的文件,它们的名字都以‘persondb'开头。这就是我们存储的文件,也就是我们的数据库,是我们备份或移动存储的时候需要复制和转移的内容。
在交互式命令窗口中可以查看这些文件:
>>> import glob
>>> glob.glob('person*')
['person.py', 'person2.py', 'persondb.bak', 'persondb.dat', 'persondb.dir']
>>> print(open('persondb.dir').read())
'Tom Jones', (1024, 91)
'Sue Jones', (512, 100)
'Bob Smith', (0, 80)
>>> print(open('persondb.dat','rb').read())
b'\x80\x03cperson\nPerson\nq\x00)\x81q\x01}q\x02(X\x03\x00\x00\x00jobq\x03NX\x03\x00\x00\x00payq\x04K\x00X\x04\x00\x00\x00nameq\x05X\t\x00\x00\x00Bob
...more omitted...
这些内容无法解读,但是我们可以用常规的Python语法和开发模式来处理它,即通过shelve来打开这些文件。
>>> import shelve
>>> db = shelve.open('persondb')
>>> for key in db:
... print(key, '=>', db[key])
...
Bob Smith => [Person:job = None,name = Bob Smith,pay = 0]
Tom Jones => [Manager:job = mgr,name = Tom Jones,pay = 50000]
Sue Jones => [Person:job = dev,name = Sue Jones,pay = 100000]
>>> len(db)
3
>>> bob = db['Bob Smith']
>>> bob.last_name()
'Smith'
在这里,为了载入或使用存储的对象,我们不一定必须导入Person或Manager类。因为Python对一个类实例进行pickle操作,它记录了其self实例属性,以及实例所创建于的类的名字和类的位置。
这种方法的结果就是,类实例在未来导入的时候,会自动地获取其所有的类行为。
更新Shelve中的对象
现在介绍最后一段脚本,编写一个程序,在每次运行的时候更新一个实例,以此证实我们的对象真的是持久化的。如下的updatadb.py打印出数据库,并且每次把我们所存储的对象之一增加一次,跟踪它的变化:
Bob Smith => [Person:job = None,name = Bob Smith,pay = 0] Sue Jones => [Person:job = dev,name = Sue Jones,pay = 110000] Tom Jones => [Manager:job = mgr,name = Tom Jones,pay = 50000] Tom Jones => [Manager:job = mgr,name = Tom Jones,pay = 50000] Sue Jones => [Person:job = dev,name = Sue Jones,pay = 121000] Bob Smith => [Person:job = None,name = Bob Smith,pay = 0] Bob Smith => [Person:job = None,name = Bob Smith,pay = 0] Sue Jones => [Person:job = dev,name = Sue Jones,pay = 133100] Tom Jones => [Manager:job = mgr,name = Tom Jones,pay = 50000]
未来方向
通过这个例子,我们可以看到了Python的OOP的所有基本机制的实际运作,并且,学习了在代码中避免冗余性及其相关可维护性问题的方法,还构建了功能完备的类来完成实际的工作。此外,我们还通过把对象存储到Python的shelve中创建了正式的数据库记录,从而使它们的信息持久地存在。
这之后还有更多的内容可以探讨,比如扩展使用工具的范围,包括Python附带的工具以及开源世界中可以免费获取的工具:
GUI:添加图形化的用户界面来浏览和更新数据库记录。可以构建能够移植到Python的tkinter的GUI,或者可以移植到WxPython和PyQt这样的第三方工具的GUI。tkinter是Python自带的,允许我们快速地构建简单的GUI,并且是学习GUI编程技巧的理想工具。
Web站点:尽管GUI方便而且很快,但Web在易用性方面胜出。Web站点可以用Python自带的基本CGI脚本编程工具来构建,也可以用像Django、TurboGears、Pylons、web2Py、Zope或Google's App Engine这样的全功能的第三方Web开发框架来完成。
数据库:如果数据库变得更大或者更关键,我们可以将其从shelve转移到像开源的ZODB面向对象数据库系统(OODB)这样一个功能更完备的存储机制中,或者像MySQL、Oracle、PostgreSQL或SQLLite这样的一个更传统的基于SQL的数据库系统中。Python自身带有一个内置的、正在使用的SQLLite数据库。
ORM:如果我们真的迁移到关系数据库中进行存储,不一定要牺牲Python的OOP工具。可以用SQLObject和SQLAlchemy这样的对象关系映射器(ORM)。
Python 面向对象程序设计 OOP 构造函数 组合类 工具类