Apache Software FoundationのプロジェクトH

Apache Software Foundation

Hadoop

Apache Hadoop

ビックデータの分散処理を行うフレームワークです。

また、Apache Software FoundationのプロジェクトはApache Hadoop関連が多いです。

これと同じくらい有名なビックデータ処理フレームワークとして、Apache Sparkもあります。

由来

Apache Hadoopの作者であるDoug Cutting氏が言及しています。
なお、原文へのURLはリンク切れです。

The name my kid gave a stuffed yellow elephant. Short, relatively easy to spell and pronounce, meaningless, and not used elsewhere: those are my naming criteria. Kids are good at generating such. Googol is a kid’s term.

私の子供が付けた黄色い象のぬいぐるみの名前から来てるよ。短くて、スペルと発音が簡単で、意味がなくて、他で使われてない、というのが命名の基準。子供はそういうの考えるのうまいよね。Googolも子供が作った言葉だし。

http://www.mwsoft.jp/programming/hadoop/where_come_from.html
原文のURL(http://weblogs.java.net/blog/tomwhite/archive/2006/02/hadoop.html)

Apache Hadoopのロゴマークが黄色い象であることもこれで分かります。

Hama

Apache Hama

BSP(Bulk Synchronous Parallel)コンピューティングモデルを使用するビックデータ分析フレームワークです。

2012年にトップレベルプロジェクトとして設立されました。

由来

公式発表はありません。不明です。

HAWQ

Apache HAWQ

Apache HadoopのネイティブSQLです。

由来

公式発表はありません。不明です。

HBase

Apache HBase

分散されたスケーラブルな非リレーショナルHadoopデータベースです。

GoogleのBigtableをによる構造化データの分散ストレージシステムをモデルに開発されました。

Apache HBaseはApache Hadoop、HDFSに加えてBigtableのような機能を提供します。

由来

公式発表はありません。不明です。

1文字目の「H」は「Hadoop」だと思います。それ以外は分かりません。

Helix

Apache Helix

分散リソース用のクラスタ管理フレームワークです。

由来

公式発表はありません。不明です。

Hive

Apache Hive

SQLを使用して、分散ストレージにある大規模なデータセットの読み取り、書き取り、管理を容易にします。

以前はApache Hadoopのサブプロジェクトでした。

由来

公式発表はありません。不明です。

HttpComponents

Apache HttpComponents

HTTPとその関連プロトコルに焦点を合わせた低レベルなJavaコンポーネントの作成と保守を担当します。

由来

公式発表はありませんが、容易に推測できます。

「HTTP」と「コンポーネント(Component)」の造語です。

 

コメント

タイトルとURLをコピーしました