Apache Spark是什么?
Apache Spark是一种开源的大数据处理框架。
这是一个可以批量处理本地或云端大规模数据的工具。
Spark有三个特点。
-
- 速度
-
- 使いやすさ
-
- モジュラリティ
- 拡張性
为了实现这些,提供了各种不同的库。
快慢的程度
-
- 大規模なデータや並列処理などに対応する最適な選択ができる
-
- 並列処理が可能
- SQLによる最適な処理
易用性 (yì
-
- シンプルで論理的なデータ構造を提供
- 慣れ親しんでいるプログラミング言語で実現することが出来る
模块化
中国話者:
模块化 = 可以实现多少种组合
- どのプログラミング言語でも同じ環境で実現できる
扩展性
- 他サービスのデータを読み込み操作をすることが出来る