国产xxxx99真实实拍_久久不雅视频_高清韩国a级特黄毛片_嗯老师别我我受不了了小说

資訊專欄INFORMATION COLUMN

h5py快速入門指南

desdik / 2679人閱讀

摘要:下面的文章主要介紹的快速入門指南,翻譯自的官方文檔。當使用時,最基本的準則為類似于字典,類似于中的數組。所有的和都支持幾個數據位的附屬命名,稱為屬性。

h5py是Python語言用來操作HDF5的模塊。下面的文章主要介紹h5py的快速入門指南,翻譯自h5py的官方文檔:http://docs.h5py.org/en/lates... 。該翻譯僅為個人學習h5py為目的,如有翻譯不當之處,請速聯系筆者或提供正確的翻譯,非常感謝!
安裝

使用Anaconda或者Miniconda:

conda install h5py

用Enthought Canopy,可以使用GUI安裝包安裝或用

enpkg h5py

安裝。用pip或setup.py安裝,請參考安裝方式。

核心概念

一個HDF5文件就是一個容器,用于儲存兩類對象:datasets,類似于數組的數據集合;groups,類似于文件夾的容器,可以儲存datasets和其它groups。當使用h5py時,最基本的準則為:

groups類似于字典(dictionaries),dataset類似于Numpy中的數組(arrays)。

假設有人給你發送了一個HDF5文件, mytestfile.hdf5(如何創建這個文件,請參考:附錄:創建一個文件).首先你需要做的就是打開這個文件用于讀取數據:

>>> import h5py
>>> f = h5py.File("mytestfile.hdf5", "r")

這個File對象是你的起點。那么這個文件中儲存了什么呢?記住,h5py.File就像一個Python字典,因此我們可以查看這些鍵值,

>>> list(f.keys())
["mydataset"]

根據我們的觀察,這個文件中有一個dataset,即mydataset. 讓我們把這個dataset作為Dataset對象來檢驗

>>> dset = f["mydataset"]

我們得到的這個對象不是一個數組,而是一個HDF5 dataset. 就像Numpy中的數據那樣,datasets有形狀(shape)和數據類型(data type)

>>> dset.shape
(100,)
>>> dset.dtype
dtype("int32")

同時它們也支持數組風格的切片操作。下面是你如何完成這個文件中的一個dataset的讀寫的方法

>>> dset[...] = np.arange(100)
>>> dset[0]
0
>>> dset[10]
10
>>> dset[0:100:10]
array([ 0, 10, 20, 30, 40, 50, 60, 70, 80, 90])

想要更多參考,請前往File Objects和Datasets.

附錄:創建一個文件

此時此刻,你也許會好奇mytestdata.hdf5是如何創建的。當File對象初始化后,我們通過將模式(mode)設置為w來創建一個文件。其它模式(mode)為a(用于讀、寫、新建)和r+(用于讀、寫)。一個完整的File模式以及它們的含義的列表可參考File對象。

>>> import h5py
>>> import numpy as np
>>> f = h5py.File("mytestfile.hdf5", "w")

File對象有幾個看上去挺有趣的方法。其一為create_dataset,顧名思義,就是通過給定形狀和數據類型來創建一個dataset

>>> dset = f.create_dataset("mydataset", (100,), dtype="i")

File對象是上下文管理器,因此,下面的代碼也可運行

>>> import h5py
>>> import numpy as np
>>> with h5py.File("mytestfile.hdf5", "w") as f:
>>>     dset = f.create_dataset("mydataset", (100,), dtype="i")
Groups和分層結構

“HDF”是“Hierarchical Data Format”的縮寫。每個HDF5文件中的對象都有一個名字(name),它們以類似于POSIX風格的分層結構存放,用/分隔符分隔

>>> dset.name
u"/mydataset"

在這個系統中“文件夾”(folders)被命名為groups. 我們創建的File對象本身也是一個group, 在這種情形下是根group(root group),名字為/:

>>> f.name
u"/"

創建一個子group(subgroup)可以通過一個巧妙的命令create_group來完成。但是,我們首先需要以讀/寫模式來打開文件

>>> f = h5py.File("mydataset.hdf5", "r+")
>>> grp = f.create_group("subgroup")

所有Group對象,如同File對象一樣,也有create_*方法:

>>> dset2 = grp.create_dataset("another_dataset", (50,), dtype="f")
>>> dset2.name
u"/subgroup/another_dataset"

順便說一句,你不需要手動地創建所有的中間groups. 指定一個完整的路徑同樣可行

>>> dset3 = f.create_dataset("subgroup2/dataset_three", (10,), dtype="i")
>>> dset3.name
u"/subgroup2/dataset_three"

Groups支持大部分的Python字典風格的接口。你可以使用條目獲取(item-retrieval)的語法來獲取這個文件中的對象:

>>> dataset_three = f["subgroup2/dataset_three"]

迭代一個group,就會產生它的成員的名字:

>>> for name in f:
...     print name
mydataset
subgroup
subgroup2

成員關系檢測也可以通過使用名字來實現:

>>> "mydataset" in f
True
>>> "somethingelse" in f
False

你甚至可以使用完整的路徑的名字:

>>> "subgroup/another_dataset" in f
True

它也有你熟悉的keys(), values(), items() 和iter() 的方法,以及get()方法。

因為迭代一個group只會產生它的直屬成員,所以想要迭代一個完整的文件,可以使用Group的方法visit()和visititems(), 它們通過一個調用(callable)來實現:

>>> def printname(name):
...     print name
>>> f.visit(printname)
mydataset
subgroup
subgroup/another_dataset
subgroup2
subgroup2/dataset_three

想要更多參考,請前往Groups.

屬性

HDF5的最好特征之一就是你可以在描述的數據后儲存元數據(metadata)。所有的groups和datasets都支持幾個數據位的附屬命名,稱為屬性。(All groups and datasets support attached named bits of data called attributes.)

屬性可以通過attrs這個代理對象來獲取,這會再一次執行字典接口:

>>> dset.attrs["temperature"] = 99.5
>>> dset.attrs["temperature"]
99.5
>>> "temperature" in dset.attrs
True

想要更多參考,請前往Attributes.

文章版權歸作者所有,未經允許請勿轉載,若此文章存在違規行為,您可以聯系管理員刪除。

轉載請注明本文地址:http://specialneedsforspecialkids.com/yun/44775.html

相關文章

  • TensorFlow 2.0 / TF2.0 入門教程實戰案例

    摘要:七強化學習玩轉介紹了使用創建來玩游戲將連續的狀態離散化。包括輸入輸出獨熱編碼與損失函數,以及正確率的驗證。 用最白話的語言,講解機器學習、神經網絡與深度學習示例基于 TensorFlow 1.4 和 TensorFlow 2.0 實現 中文文檔 TensorFlow 2 / 2.0 官方文檔中文版 知乎專欄 歡迎關注我的知乎專欄 https://zhuanlan.zhihu.com/...

    whataa 評論0 收藏0
  • 22、Python快速開發分布式搜索引擎Scrapy精講—scrapy模擬登陸和知乎倒立文字驗證碼識

    【百度云搜索,搜各種資料:http://www.bdyss.cn】 【搜網盤,搜各種資料:http://www.swpan.cn】 第一步。首先下載,大神者也的倒立文字驗證碼識別程序 下載地址:https://github.com/muchrooms/... 注意:此程序依賴以下模塊包   Keras==2.0.1  Pillow==3.4.2  jupyter==1.0.0  matplotli...

    array_huang 評論0 收藏0

發表評論

0條評論

最新活動
閱讀需要支付1元查看
<