Hadoop和快乐的伙伴们

2 年 ago

韵, 科

2 minutes

这是一份属于我自己的备忘录。

大数据分布式处理

インメモリー処理を主体

Storm

リアルタイムHadoop

Hadoop大数据处理框架

Hadoop による分散データ処理: 第 3 回アプリケーション開発

火花

Apache Spark の紹介（前半：Sparkのキホン）

暴风雨

Twitter Storm でビッグ・データをリアルタイムに処理する

分布式文件系统

HTTP REST APIでHDFSにアクセスできる機能

HDFS（Hadoop分布式文件系统）

HDFSおよびMapReduce

WebHDFS可以以本地方式进行连接。

WebHDFSの性能評価

Hadoop中的算法。(Hadoop de fǎ.)

Tez

MapReduce 分布式计算模型

MapReduce

毛线

YARNの登場によりHadoopは複数の並列分散処理エンジンを併用できる環境へ。Hadoop Conference Japan 2014

可以这样表达：Tez

Apache Tez
リピさんとオザさんのTezとSparkの会話

泳道

とりあえずTezのswimlanesを動かしてみた

散布式儲存系統

HBase → HBase

HBaseとはどんなNoSQLデータベースなのか？日本語で読める情報を集めてみた

SQL 查询引擎

Presto

蜂巢

SQL と Hadoop の間での双方向のデータ転送: 第 2 回 HBase と Hive を利用する

猪

Apache Pig で大規模データセットを分散処理する

展现

Facebook、分散SQLエンジン「Presto」公開。大規模データをMapReduce/Hiveの10倍効率よく処理すると

普雷斯托格雷斯

CognosからPrestogres経由でPrestoにつないだ話

其他

Hcatalog (汇总目录)

HCatalog

色相

HueでHadoopをWeb UIから使う

Zipkin (中文名：齐皮金)

LINEのマイクロサービス環境における分散トレーシング