Omniduct

從各種資料來源提取資料的介面
90
作者Daniel Frank, Matthew Wardrop

Omniduct 提供統一的介面,用於連接和提取來自各種(可能遠端的)資料儲存庫(包括 HDFS、Hive、Presto、MySQL 等)的資料。

文件: http://omniduct.readthedocs.io
原始碼: https://github.com/airbnb/omniduct
錯誤報告: https://github.com/airbnb/omniduct/issues

它提供

  • 一個通用的、基於插件的程式化 API,用於以一致的方式跨不同服務存取資料(請參閱支援的協定)。
  • 一個框架,用於延遲連接到資料來源,並在相關 Python 會話的整個生命週期中維護這些連接。
  • 在無法直接連線的情況下,透過 SSH 自動轉發遠端服務的連接埠。
  • 方便的 IPython 魔術函數,用於在 IPython 和 Jupyter Notebook 會話中與資料提供者介面互動。
  • 輔助類別和方法,用於協助維護有用服務的註冊表。

Omniduct 的設計使其可以直接方便地使用(每個使用者都可以配置自己的服務定義),也可以透過其他套件使用(可以建立預先定義的服務庫,例如公司)。 有關如何部署 omniduct 的更多資訊,請參閱部署

連結