摘要:起步上一篇的枚舉類型文末說有機會的話可以看看它的源碼。但這樣的方式并不好,范圍大,它包含該類的所有屬性和方法。而不單單是枚舉的命名空間。每個成員都有名稱屬性和值屬性上述的代碼中,取得的值是。
起步
上一篇 《Python 的枚舉類型》 文末說有機會的話可以看看它的源碼。那就來讀一讀,看看枚舉的幾個重要的特性是如何實現的。
要想閱讀這部分,需要對元類編程有所了解。
成員名不允許重復這部分我的第一個想法是去控制 __dict__ 中的 key 。但這樣的方式并不好,__dict__ 范圍大,它包含該類的所有屬性和方法。而不單單是枚舉的命名空間。我在源碼中發現 enum 使用另一個方法。通過 __prepare__ 魔術方法可以返回一個類字典實例,在該實例
使用 __prepare__ 魔術方法自定義命名空間,在該空間內限定成員名不允許重復。
# 自己實現 class _Dict(dict): def __setitem__(self, key, value): if key in self: raise TypeError("Attempted to reuse key: %r" % key) super().__setitem__(key, value) class MyMeta(type): @classmethod def __prepare__(metacls, name, bases): d = _Dict() return d class Enum(metaclass=MyMeta): pass class Color(Enum): red = 1 red = 1 # TypeError: Attempted to reuse key: "red"
再看看 Enum 模塊的具體實現:
class _EnumDict(dict): def __init__(self): super().__init__() self._member_names = [] ... def __setitem__(self, key, value): ... elif key in self._member_names: # descriptor overwriting an enum? raise TypeError("Attempted to reuse key: %r" % key) ... self._member_names.append(key) super().__setitem__(key, value) class EnumMeta(type): @classmethod def __prepare__(metacls, cls, bases): enum_dict = _EnumDict() ... return enum_dict class Enum(metaclass=EnumMeta): ...
模塊中的 _EnumDict 創建了 _member_names 列表來存儲成員名,這是因為不是所有的命名空間內的成員都是枚舉的成員。比如 __str__, __new__ 等魔術方法就不是了,所以這邊的 __setitem__ 需要做一些過濾:
def __setitem__(self, key, value): if _is_sunder(key): # 下劃線開頭和結尾的,如 _order__ raise ValueError("_names_ are reserved for future Enum use") elif _is_dunder(key): # 雙下劃線結尾的, 如 __new__ if key == "__order__": key = "_order_" elif key in self._member_names: # 重復定義的 key raise TypeError("Attempted to reuse key: %r" % key) elif not _is_descriptor(value): # value得不是描述符 self._member_names.append(key) self._last_values.append(value) super().__setitem__(key, value)
模塊考慮的會更全面。
每個成員都有名稱屬性和值屬性上述的代碼中,Color.red 取得的值是 1。而 eumu 模塊中,定義的枚舉類中,每個成員都是有名稱和屬性值的;并且細心的話還會發現 Color.red 是 Color 的示例。這樣的情況是如何來實現的呢。
還是用元類來完成,在元類的 __new__ 中實現,具體的思路是,先創建目標類,然后為每個成員都創建一樣的類,再通過 setattr 的方式將后續的類作為屬性添加到目標類中,偽代碼如下:
def __new__(metacls, cls, bases, classdict): __new__ = cls.__new__ # 創建枚舉類 enum_class = super().__new__() # 每個成員都是cls的示例,通過setattr注入到目標類中 for name, value in cls.members.items(): member = super().__new__() member.name = name member.value = value setattr(enum_class, name, member) return enum_class
來看下一個可運行的demo:
class _Dict(dict): def __init__(self): super().__init__() self._member_names = [] def __setitem__(self, key, value): if key in self: raise TypeError("Attempted to reuse key: %r" % key) if not key.startswith("_"): self._member_names.append(key) super().__setitem__(key, value) class MyMeta(type): @classmethod def __prepare__(metacls, name, bases): d = _Dict() return d def __new__(metacls, cls, bases, classdict): __new__ = bases[0].__new__ if bases else object.__new__ # 創建枚舉類 enum_class = super().__new__(metacls, cls, bases, classdict) # 創建成員 for member_name in classdict._member_names: value = classdict[member_name] enum_member = __new__(enum_class) enum_member.name = member_name enum_member.value = value setattr(enum_class, member_name, enum_member) return enum_class class MyEnum(metaclass=MyMeta): pass class Color(MyEnum): red = 1 blue = 2 def __str__(self): return "%s.%s" % (self.__class__.__name__, self.name) print(Color.red) # Color.red print(Color.red.name) # red print(Color.red.value) # 1
enum 模塊在讓每個成員都有名稱和值的屬性的實現思路是一樣的(代碼我就不貼了)。EnumMeta.__new__ 是該模塊的重點,幾乎所有枚舉的特性都在這個函數實現。
當成員值相同時,第二個成員是第一個成員的別名從這節開始就不再使用自己實現的類的說明了,而是通過拆解 enum 模塊的代碼來說明其實現了,從模塊的使用特性中可以知道,如果成員值相同,后者會是前者的一個別名:
from enum import Enum class Color(Enum): red = 1 _red = 1 print(Color.red is Color._red) # True
從這可以知道,red和_red是同一對象。這又要怎么實現呢?
元類會為枚舉類創建 _member_map_ 屬性來存儲成員名與成員的映射關系,如果發現創建的成員的值已經在映射關系中了,就會用映射表中的對象來取代:
class EnumMeta(type): def __new__(metacls, cls, bases, classdict): ... # create our new Enum type enum_class = super().__new__(metacls, cls, bases, classdict) enum_class._member_names_ = [] # names in definition order enum_class._member_map_ = OrderedDict() # name->value map for member_name in classdict._member_names: enum_member = __new__(enum_class) # If another member with the same value was already defined, the # new member becomes an alias to the existing one. for name, canonical_member in enum_class._member_map_.items(): if canonical_member._value_ == enum_member._value_: enum_member = canonical_member # 取代 break else: # Aliases don"t appear in member names (only in __members__). enum_class._member_names_.append(member_name) # 新成員,添加到_member_names_中 enum_class._member_map_[member_name] = enum_member ...
從代碼上來看,即使是成員值相同,還是會先為他們都創建對象,不過后創建的很快就會被垃圾回收掉了(我認為這邊是有優化空間的)。通過與 _member_map_ 映射表做對比,用以創建該成員值的成員取代后續,但兩者成員名都會在 _member_map_ 中,如例子中的 red 和 _red 都在該字典,但他們指向的是同一個對象。
屬性 _member_names_ 只會記錄第一個,這將會與枚舉的迭代有關。
可以通過成員值來獲取成員print(Color["red"]) # Color.red 通過成員名來獲取成員 print(Color(1)) # Color.red 通過成員值來獲取成員
枚舉類中的成員都是單例模式,元類創建的枚舉類中還維護了值到成員的映射關系 _value2member_map_ :
class EnumMeta(type): def __new__(metacls, cls, bases, classdict): ... # create our new Enum type enum_class = super().__new__(metacls, cls, bases, classdict) enum_class._value2member_map_ = {} for member_name in classdict._member_names: value = enum_members[member_name] enum_member = __new__(enum_class) enum_class._value2member_map_[value] = enum_member ...
然后在 Enum 的 __new__ 返回該單例即可:
class Enum(metaclass=EnumMeta): def __new__(cls, value): if type(value) is cls: return value # 嘗試從 _value2member_map_ 獲取 try: if value in cls._value2member_map_: return cls._value2member_map_[value] except TypeError: # 從 _member_map_ 映射獲取 for member in cls._member_map_.values(): if member._value_ == value: return member raise ValueError("%r is not a valid %s" % (value, cls.__name__))迭代的方式遍歷成員
枚舉類支持迭代的方式遍歷成員,按定義的順序,如果有值重復的成員,只獲取重復的第一個成員。對于重復的成員值只獲取第一個成員,正好屬性 _member_names_ 只會記錄第一個:
class Enum(metaclass=EnumMeta): def __iter__(cls): return (cls._member_map_[name] for name in cls._member_names_)總結
enum 模塊的核心特性的實現思路就是這樣,幾乎都是通過元類黑魔法來實現的。對于成員之間不能做比較大小但可以做等值比較。這反而不需要講,這其實繼承自 object 就是這樣的,不用額外做什么就有的“特性”了。
總之,enum 模塊相對獨立,且代碼量不多,對于想知道元類編程可以閱讀一下,教科書式教學,還有單例模式等,值得一讀。
文章版權歸作者所有,未經允許請勿轉載,若此文章存在違規行為,您可以聯系管理員刪除。
轉載請注明本文地址:http://specialneedsforspecialkids.com/yun/42781.html
摘要:起步的原生類型中并不包含枚舉類型。枚舉類型可以看作是一種標簽或是一系列常量的集合,通常用于表示某些特定的有限集合,例如星期月份狀態等。簡單的示例枚舉成員有值默認可重復,枚舉成員具有友好的字符串表示枚舉類型不可實例化,不可更改。 起步 Python 的原生類型中并不包含枚舉類型。為了提供更好的解決方案,Python 通過 PEP 435 在 3.4 版本中添加了 enum 標準庫。 枚舉...
摘要:中的枚舉類型枚舉類型可以看作是一種標簽或是一系列常量的集合,通常用于表示某些特定的有限集合,例如星期月份狀態等。 Python 中的枚舉類型 枚舉類型可以看作是一種標簽或是一系列常量的集合,通常用于表示某些特定的有限集合,例如星期、月份、狀態等。Python 的原生類型(Built-in types)里并沒有專門的枚舉類型,但是我們可以通過很多方法來實現它,例如字典、類等: WEEKD...
摘要:枚舉類型可以看作是一種標簽或是一系列常量的集合,通常用于表示某些特定的有限集合,例如星期月份狀態等。 showImg(https://segmentfault.com/img/remote/1460000018679998?w=740&h=728); 枚舉類型可以看作是一種標簽或是一系列常量的集合,通常用于表示某些特定的有限集合,例如星期、月份、狀態等。 Python 的原生類型(Bu...
摘要:入門細節相除后的類型雙斜杠是整除,出來的類型是。序列,集合和字典屬于組,是的基本數據類型。變量名區分大小寫。盡量避免循環引入。變量函數等引入內指定的變量函數等。中如果沒有出現模塊名也是絕對導入。頂級包與入口文件的位置 python入門細節 相除后的類型 type(2/2) float type(2//2) int 雙斜杠是整除,出來的類型是int。單斜杠的出來的是float類型。 進制...
摘要:模塊定義了種枚舉類裝飾器助手在中加入創建枚舉注意點枚舉值可以是任何類型,如果值不重要可以使用自動選擇。使用裝飾器可以對枚舉值進行唯一約束枚舉專用的類裝飾器。序列化一般要求序列化的枚舉要定義在模塊頂層,因為反序列化要求枚舉能夠從模塊導入。 enum模塊定義了: 4種枚舉類:Enum, IntEnum, Flag, IntFlag 裝飾器:unique() 助手:auto Flag, ...
閱讀 2371·2021-11-18 10:07
閱讀 2325·2021-09-22 15:59
閱讀 3085·2021-08-23 09:42
閱讀 2283·2019-08-30 15:44
閱讀 1198·2019-08-29 15:06
閱讀 2321·2019-08-29 13:27
閱讀 1219·2019-08-29 13:21
閱讀 1420·2019-08-29 13:13