今天我將帶大家設(shè)計一個簡單的orm框架,并簡單剖析一下YAML這個序列化工具的原理。
Python類的上帝-type
說到metaclass,我們首先必須清楚一個最基礎(chǔ)的概念就是對象是類的實例,而類是type的實例,重復一遍:
- 對象是類的實例
- 類是type的實例
在面向?qū)ο蟮?a href="http://www.1cnz.cn/v/tag/1315/" target="_blank">編程模型中,類就相當于一個房子的設(shè)計圖紙,而對象則是根據(jù)這個設(shè)計圖紙建出來的房子。
下圖中,玩具模型就可以代表一個類,而具體生產(chǎn)出來的玩具就可以代表一個對象:
總之,類就是創(chuàng)建對象的模板。
而type又是創(chuàng)建類的模板,那么我們就可以通過type創(chuàng)建自己想要的類。
比如定義一個 Hello 的 class:
class Hello(object):
def hello(self, name='world'):
print('Hello, %s.' % name)
當 Python 解釋器載入 hello 模塊時,就會依次執(zhí)行該模塊的所有語句,執(zhí)行結(jié)果就是動態(tài)創(chuàng)建出一個 Hello 的 class對象。
type()函數(shù)既可以查看一個類型或變量的類型,也可以根據(jù)參數(shù)創(chuàng)建出新的類型,比如上面那段類的定義本質(zhì)上就是:
def hello(self, name='world'):
print('Hello, %s.' % name)
Hello = type('Hello', (object,), dict(hello=hello))
type()函數(shù)創(chuàng)建class 對象,依次傳入 3 個參數(shù):
- class 類的名稱;
- 繼承的父類集合,注意 Python 支持多重繼承,如果只有一個父類,別忘了 tuple 的單元素寫法;
- class 的方法名稱與函數(shù)綁定以及字段名稱與對應的值,這里我們把函數(shù) fn 綁定到方法名 hello 上。
通過 type() 函數(shù)創(chuàng)建的類和直接寫 class 是完全一樣的,因為 Python 解釋器遇到 class 定義時,僅僅是掃描一下class 定義的語法,然后調(diào)用 type() 函數(shù)創(chuàng)建出 class。
正常情況下,我們肯定都是用 class Xxx... 來定義類,但是type() 函數(shù)允許我們動態(tài)創(chuàng)建出類來,這意味著Python這門動態(tài)語言支持運行期動態(tài)創(chuàng)建類。你可能感受不到這有多強大,要知道想在靜態(tài)語言運行期創(chuàng)建類,必須構(gòu)造源代碼字符串再調(diào)用編譯器,或者借助一些工具生成字節(jié)碼實現(xiàn),本質(zhì)上都是動態(tài)編譯,會非常復雜。
metaclass到底是什么
那type和metaclass有什么關(guān)系呢?metaclass到底是什么呢?
我認為metaclass 其實就是type或type的子類,通過繼承type,重載__call__
運算符,便可以在class類對象創(chuàng)建時作出一些修改。
對于類 MyClass:
class MyClass():
pass
其實相當于:
class MyClass(metaclass = type):
pass
一旦我們把它的 metaclass 設(shè)置成 MyMeta:
class MyClass(metaclass = MyMeta):
pass
MyClass 就不再由原生的 type 創(chuàng)建,而是會調(diào)用 MyMeta 的__call__
運算符重載。
class = type(classname, superclasses, attributedict)
## 變?yōu)榱?/span>
class = MyMeta(classname, superclasses, attributedict)
對于具有繼承關(guān)系的類:
class Foo(Bar):
pass
Python做了如下的操作:
- Foo中有__metaclass__這個屬性嗎?如果是,Python會通過__metaclass__創(chuàng)建一個名字為Foo的類(對象)
- 如果Python沒有找到__metaclass__,它會繼續(xù)在Bar(父類)中尋找__metaclass__屬性,并嘗試做和前面同樣的操作。
- 如果Python在任何父類中都找不到__metaclass__,它就會在模塊層次中去尋找__metaclass__,并嘗試做同樣的操作。
- 如果還是找不到__metaclass__,Python就會用內(nèi)置的type來創(chuàng)建這個類對象。
假想一個很傻的例子,你決定在你的模塊里所有的類的屬性都應該是大寫形式。有好幾種方法可以辦到,但其中一種就是通過在模塊級別設(shè)定__metaclass__:
class UpperAttrMetaClass(type):
## __new__ 是在__init__之前被調(diào)用的特殊方法
## __new__是用來創(chuàng)建對象并返回之的方法
## 而__init__只是用來將傳入的參數(shù)初始化給對象
## 你很少用到__new__,除非你希望能夠控制對象的創(chuàng)建
## 這里,創(chuàng)建的對象是類,我們希望能夠自定義它,所以我們這里改寫__new__
## 如果你希望的話,你也可以在__init__中做些事情
## 還有一些高級的用法會涉及到改寫__call__特殊方法,但是我們這里不用
def __new__(cls, future_class_name, future_class_parents, future_class_attr):
##遍歷屬性字典,把不是__開頭的屬性名字變?yōu)榇髮?/span>
newAttr = {}
for name,value in future_class_attr.items():
if not name.startswith("__"):
newAttr[name.upper()] = value
## 方法1:通過'type'來做類對象的創(chuàng)建
## return type(future_class_name, future_class_parents, newAttr)
## 方法2:復用type.__new__方法,這就是基本的OOP編程
## return type.__new__(cls, future_class_name, future_class_parents, newAttr)
## 方法3:使用super方法
return super(UpperAttrMetaClass, cls).__new__(cls, future_class_name, future_class_parents, newAttr)
class Foo(object, metaclass = UpperAttrMetaClass):
bar = 'bip'
print(hasattr(Foo, 'bar'))
## 輸出: False
print(hasattr(Foo, 'BAR'))
## 輸出:True
f = Foo()
print(f.BAR)
## 輸出:'bip'
簡易ORM框架的設(shè)計
ORM全稱“Object Relational Mapping”,即對象-關(guān)系映射,就是把關(guān)系數(shù)據(jù)庫的一行映射為一個對象,也就是一個類對應一個表,這樣,寫代碼更簡單,不用直接操作SQL語句。
現(xiàn)在設(shè)計一下ORM框架的調(diào)用接口,比如用戶想通過User
類來操作對應的數(shù)據(jù)庫表User
,我們期待他寫出這樣的代碼:
class User(Model):
## 定義類的屬性到列的映射:
id = IntegerField('id')
name = StringField('username')
email = StringField('email')
password = StringField('password')
## 創(chuàng)建一個實例:
u = User(id=12345, name='xiaoxiaoming', email='test@orm.org', password='my-pwd')
## 保存到數(shù)據(jù)庫:
u.save()
上面的接口通過常規(guī)方法很難或幾乎很難實現(xiàn),但通過metaclass就會相對比較簡單。核心思想就是通過metaclass修改類的定義,將類的所有Field類型的屬性,用一個額外的字典去保存,然后從原定義中刪除。對于User創(chuàng)建對象時傳入的參數(shù)(id=12345, name='xiaoxiaoming'等)可以模仿字典的實現(xiàn)或直接繼承dict類保存起來。
其中,父類Model
和屬性類型StringField
、IntegerField
是由ORM框架提供的,剩下的魔術(shù)方法比如save()
全部由metaclass自動完成。雖然metaclass的編寫會比較復雜,但ORM的使用者用起來卻異常簡單。
首先定義Field類,它負責保存數(shù)據(jù)庫表的字段名和字段類型:
class Field(object):
def __init__(self, name, column_type):
self.name = name
self.column_type = column_type
def __str__(self):
return '< %s:%s >' % (self.__class__.__name__, self.name)
在Field的基礎(chǔ)上,進一步定義各種類型的Field,比如StringField,IntegerField等等:
class StringField(Field):
def __init__(self, name):
super(StringField, self).__init__(name, 'varchar(100)')
class IntegerField(Field):
def __init__(self, name):
super(IntegerField, self).__init__(name, 'bigint')
下一步,編寫ModelMetaclass:
class ModelMetaclass(type):
def __new__(cls, name, bases, attrs):
if name == 'Model':
return type.__new__(cls, name, bases, attrs)
print('Found model: %s' % name)
mappings = dict()
for k, v in attrs.items():
if isinstance(v, Field):
print('Found mapping: %s == > %s' % (k, v))
mappings[k] = v
for k in mappings.keys():
attrs.pop(k)
attrs['__mappings__'] = mappings ## 保存屬性和列的映射關(guān)系
attrs.setdefault('__table__', name) ## 當未定義__table__屬性時,表名直接使用類名
return type.__new__(cls, name, bases, attrs)
以及基類Model:
class Model(dict, metaclass=ModelMetaclass):
def __init__(self, **kw):
super(Model, self).__init__(**kw)
def __getattr__(self, key):
try:
return self[key]
except KeyError:
raise AttributeError(r"'Model' object has no attribute '%s'" % key)
def __setattr__(self, key, value):
self[key] = value
def save(self):
fields = []
params = []
args = []
for k, v in self.__mappings__.items():
fields.append(v.name)
params.append('?')
args.append(getattr(self, k, None))
sql = 'insert into %s (%s) values (%s)' % (self.__table__, ','.join(fields), ','.join(params))
print('SQL: %s' % sql)
print('ARGS: %s' % str(args))
在ModelMetaclass
中,一共做了幾件事情:
- 在當前類(比如
User
)中查找定義的類的所有屬性,如果找到一個Field屬性,就把它保存到一個__mappings__
的dict中,同時從類屬性中刪除該Field屬性(避免實例的屬性遮蓋類的同名屬性); - 當類中未定義
__table__
字段時,直接將類名保存到__table__
字段中作為表名。
在Model
類中,就可以定義各種操作數(shù)據(jù)庫的方法,比如save()
,delete()
,find()
,update
等等。
我們實現(xiàn)了save()
方法,把一個實例保存到數(shù)據(jù)庫中。因為有表名,屬性到字段的映射和屬性值的集合,就可以構(gòu)造出INSERT
語句。
測試:
u = User(id=12345, name='xiaoxiaoming', email='test@orm.org', password='my-pwd')
u.save()
輸出如下:
Found model: User
Found mapping: id == > < IntegerField:id >
Found mapping: name == > < StringField:username >
Found mapping: email == > < StringField:email >
Found mapping: password == > < StringField:password >
SQL: insert into User (id,username,email,password) values (?,?,?,?)
ARGS: [12345, 'xiaoxiaoming', 'test@orm.org', 'my-pwd']
測試2:
class Blog(Model):
__table__ = 'blogs'
id = IntegerField('id')
user_id = StringField('user_id')
user_name = StringField('user_name')
name = StringField('user_name')
summary = StringField('summary')
content = StringField('content')
b = Blog(id=12345, user_id='user_id1', user_name='xxm', name='orm框架的基本運行機制', summary="簡單講述一下orm框架的基本運行機制",
content="此處省略一萬字...")
b.save()
輸出:
Found model: Blog
Found mapping: id == > < IntegerField:id >
Found mapping: user_id == > < StringField:user_id >
Found mapping: user_name == > < StringField:user_name >
Found mapping: name == > < StringField:user_name >
Found mapping: summary == > < StringField:summary >
Found mapping: content == > < StringField:content >
SQL: insert into blogs (id,user_id,user_name,user_name,summary,content) values (?,?,?,?,?,?)
ARGS: [12345, 'user_id1', 'xxm', 'orm框架的基本運行機制', '簡單講述一下orm框架的基本運行機制', '此處省略一萬字...']
可以看到,save()
方法已經(jīng)打印出了可執(zhí)行的SQL語句,以及參數(shù)列表,只需要真正連接到數(shù)據(jù)庫,執(zhí)行該SQL語句,就可以完成真正的功能。
YAML序列化工具的實現(xiàn)原理淺析
YAML是一個家喻戶曉的 Python 工具,可以方便地序列化 / 逆序列化結(jié)構(gòu)數(shù)據(jù)。
官方文檔:https://pyyaml.org/wiki/PyYAMLDocumentation
安裝:
pip install pyyaml
YAMLObject 的任意子類支持序列化和反序列化(serialization & deserialization)。比如說下面這段代碼:
import yaml
class Monster(yaml.YAMLObject):
yaml_tag = '!Monster'
def __init__(self, name, hp, ac, attacks):
self.name = name
self.hp = hp
self.ac = ac
self.attacks = attacks
def __repr__(self):
return f"{self.__class__.__name__}(name={self.name}, hp={self.hp}, ac={self.ac}, attacks={self.attacks})"
monster1 = yaml.load("""
--- !Monster
name: Cave spider
hp: [2,6]
ac: 16
attacks: [BITE, HURT]
""")
print(monster1, type(monster1))
monster2 = Monster(name='Cave lizard', hp=[3, 6], ac=16, attacks=['BITE', 'HURT'])
print(yaml.dump(monster2))
運行結(jié)果:
Monster(name=Cave spider, hp=[2, 6], ac=16, attacks=['BITE', 'HURT']) < class '__main__.Monster' >
!Monster
ac: 16
attacks: [BITE, HURT]
hp: [3, 6]
name: Cave lizard
這里面調(diào)用統(tǒng)一的 yaml.load(),就能把任意一個 yaml 序列載入成一個 Python Object;而調(diào)用統(tǒng)一的 yaml.dump(),就能把一個 YAMLObject 子類序列化。
對于 load() 和 dump() 的使用者來說,他們完全不需要提前知道任何類型信息,這讓超動態(tài)配置編程成了可能。比方說,在一個智能語音助手的大型項目中,我們有 1 萬個語音對話場景,每一個場景都是不同團隊開發(fā)的。作為智能語音助手的核心團隊成員,我不可能去了解每個子場景的實現(xiàn)細節(jié)。
在動態(tài)配置實驗不同場景時,經(jīng)常是今天我要實驗場景 A 和 B 的配置,明天實驗 B 和 C 的配置,光配置文件就有幾萬行量級,工作量不可謂不小。而應用這樣的動態(tài)配置理念,就可以讓引擎根據(jù)配置文件,動態(tài)加載所需要的 Python 類。
對于 YAML 的使用者也很方便,只要簡單地繼承 yaml.YAMLObject,就能讓你的 Python Object 具有序列化和逆序列化能力。
據(jù)說即使是在大廠 Google 的 Python 開發(fā)者,發(fā)現(xiàn)能深入解釋 YAML 這種設(shè)計模式優(yōu)點的人,大概只有 10%。而能知道類似 YAML 的這種動態(tài)序列化 / 逆序列化功能正是用 metaclass 實現(xiàn)的人,可能只有 1% 了。而能夠?qū)AML 怎樣用 metaclass 實現(xiàn)動態(tài)序列化 / 逆序列化功能講出一二的可能只有 0.1%了。
對于YAMLObject 的 load和dump() 功能,簡單來說,我們需要一個全局的注冊器,讓 YAML 知道,序列化文本中的!Monster
需要載入成 Monster 這個 Python 類型,Monster 這個 Python 類型需要被序列化為!Monster
標簽開頭的字符串。
一個很自然的想法就是,那我們建立一個全局變量叫 registry,把所有需要逆序列化的 YAMLObject,都注冊進去。比如下面這樣:
registry = {}
def add_constructor(target_class):
registry[target_class.yaml_tag] = target_class
然后,在 Monster 類定義后面加上下面這行代碼:
add_constructor(Monster)
這樣的缺點很明顯,對于 YAML 的使用者來說,每一個 YAML 的可逆序列化的類 Foo 定義后,都需要加上一句話add_constructor(Foo)
。這無疑給開發(fā)者增加了麻煩,也更容易出錯,畢竟開發(fā)者很容易忘了這一點。
更優(yōu)雅的實現(xiàn)方式自然是通過metaclass 解決了這個問題,YAML 的源碼正是這樣實現(xiàn)的:
class YAMLObjectMetaclass(type):
def __init__(cls, name, bases, kwds):
super(YAMLObjectMetaclass, cls).__init__(name, bases, kwds)
if 'yaml_tag' in kwds and kwds['yaml_tag'] is not None:
cls.yaml_loader.add_constructor(cls.yaml_tag, cls.from_yaml)
cls.yaml_dumper.add_representer(cls, cls.to_yaml)
## 省略其余定義
class YAMLObject(metaclass=YAMLObjectMetaclass):
yaml_loader = Loader
yaml_dumper = Dumper
## 省略其余定義
可以看到,YAMLObject 把 metaclass 聲明成了 YAMLObjectMetaclass,YAMLObjectMetaclass則會改變YAMLObject類和其子類的定義,就是下面這行代碼將YAMLObject 的子類加入到了yaml的兩個全局注冊表中:
cls.yaml_loader.add_constructor(cls.yaml_tag, cls.from_yaml)
cls.yaml_dumper.add_representer(cls, cls.to_yaml)
YAML 應用 metaclass,攔截了所有 YAMLObject 子類的定義。也就是說,在你定義任何 YAMLObject 子類時,Python 會強行插入運行上面這段代碼,把我們之前想要的add_constructor(Foo)
和add_representer(Foo)
給自動加上。所以 YAML 的使用者,無需自己去手寫add_constructor(Foo)
和add_representer(Foo)
。
總結(jié)
這次分享主要是簡單的淺析了 metaclass 的實現(xiàn)機制。通過實現(xiàn)一個orm框架并解讀 YAML 的源碼,相信你已經(jīng)對metaclass 有了不錯的理解。
metaclass 是 Python 黑魔法級別的語言特性,它可以改變類創(chuàng)建時的行為,這種強大的功能使用起來務(wù)必小心。
看完本文,你覺得裝飾器和 metaclass 有什么區(qū)別呢?歡迎下方留言和我討論。記得一鍵三連呦,筆芯!
-
Type
+關(guān)注
關(guān)注
1文章
137瀏覽量
22706 -
python
+關(guān)注
關(guān)注
56文章
4800瀏覽量
84821 -
YAML
+關(guān)注
關(guān)注
0文章
21瀏覽量
2334 -
編程模型
+關(guān)注
關(guān)注
0文章
8瀏覽量
1407
發(fā)布評論請先 登錄
相關(guān)推薦
評論