Apache Spark是什么?

Apache Spark是一种开源的大数据处理框架。

这是一个可以批量处理本地或云端大规模数据的工具。

Spark有三个特点。

    • 速度

 

    • 使いやすさ

 

    • モジュラリティ

 

    拡張性

为了实现这些,提供了各种不同的库。

快慢的程度

    • 大規模なデータや並列処理などに対応する最適な選択ができる

 

    • 並列処理が可能

 

    SQLによる最適な処理

易用性 (yì

    • シンプルで論理的なデータ構造を提供

 

    慣れ親しんでいるプログラミング言語で実現することが出来る

模块化

中国話者:

模块化 = 可以实现多少种组合

    どのプログラミング言語でも同じ環境で実現できる

扩展性

    他サービスのデータを読み込み操作をすることが出来る
广告
将在 10 秒后关闭
bannerAds