用一句话描述大数据开源软件
首先
我可能需要接触与大数据相关的开源软件,但是它们非常相似,我并不是很清楚哪一个是什么,所以我试图用一个流行(?)的简短句子来解释。(云服务不包括在内)
大数据开源软件
OSS説明Apache ApexDAG に処理を記述する YARN ベースのストリーミング、バッチ処理エンジンApache Beamバッチ、ストリーミングデータの並列処理パイプラインが作れるプログラミングモデルApache CassandraFacebook が作った NoSQL 分散データベース管理システムApache FlinkYARN 上で動くバッチ処理もできるリアルタイムストリーミング処理プラットフォームApache HadoopJava で作られた分散ファイルシステム HDFS と並列分散処理フレームワーク MapReduce が使えるフレームワークApache HbaseGoogle BigTable のような Hadoop の分散ファイルシステム HDFS 上で動作するNosqlデータベースApache HiveSQLっぽい HiveQL が使える Hadoop 上で動くデータベース管理システムApache HudiUber が作った各種 DFS からビッグデータ分析データセットを取り込めるストレージ管理システムApache Igniteビッグデータをインメモリで処理可能なスケーラブル、フォールトトレラント分散インメモリコンピューティングプラットフォームApache Samzaリアルタイムでストリーミングを処理できる分散非同期処理フレームワークApache Storm分散ほぼリアルタイム高速分析プラットフォームApache SparkScala、Java、Python でビッグデータのスケーラブルな分散処理を作れるフレームワークApache Spark StreamingSpark を拡張しマイクロバッチによるスケーラブルなリアルタイムストリーミング処理が可能になるエンジンPrestoFacebook が開発した Hive と同じような大規模データ分析クエリ実行用分散型 SQL クエリエンジンYARNHadoop でアプリケーションの作成を簡単にするクラスタリソース管理フレームワーク
结束
我还是有点模糊不清。我会随时进行修正,如果有任何不足之处,我会进行更新。