最终,人们最关心的问题是服务器监控的经济情况

image.png
    1. 首先

 

    1. 企业服务器监控

 

    1. 替代内部服务器监控方案

AWS云监控
MetricFire
Grafana实验室
Datadog
New Relic

首先

在现代的IT环境中,积极监控与服务器相关的基础设施非常重要。然而,监控解决方案有许多不同类型,各有优缺点。有一些解决方案专为特定平台设计,有些适用于本地服务器,还有些能够在云平台上最佳运行。此外,还有一些解决方案相较于其他的更容易部署,与数据源的集成范围更广,还有些具有易于理解、精美的UI界面等特点。而用户最关心的是成本,因为不同解决方案的成本差异很大。

在这篇文章中,我们将对流行的服务器监控解决方案进行比较。是否存在不受平台限制、成本效益高且易于使用的解决方案呢?

首先先说一下。答案是”是的”。

MetricFire提供了价格实惠的工具,同时保持了用户所需的功能。我们还准备了免费演示和免费试用版本,所以请务必亲自使用并确认一下。

2. 企业服务器监控

首先,让我们明确一下「服务器监视」是什么,它的对象是什么。从非常基本的层面上来说,服务器监视可以定义为一系列的过程和行动,旨在对可用性、运营、性能、安全性以及其他运营相关流程进行评估和分析。

在本文中,我們將主要談論實際服務器硬件(包括物理硬件和虛擬硬件)的性能。應用程序的性能直接與服務器資源的性能相關,除非受到影響,否則排除應用程序的性能(APM)。

为了解释服务器监控如何与应用性能管理(APM)相关,让我们考虑依赖于预留服务器内存量的应用程序指标(例如内存数据库)。在这种情况下,如果服务器的内存经常满了,无法分配预留内存,那么应用程序指标显然会受到负面影响,对吗?在这种情况下,我们可以将应用程序的预留内存需求作为设置服务器的内存限制和指标的基准。

管理日渐增多的服务器使用有限的人力资源是在监控服务器和应用程序时必须克服的挑战。随着服务器数量的增加,增加专注于监控的IT工程师人数既不明智,也不现实。我们所需的是可扩展的服务器监控解决方案。对于IT监控人员来说,能够快速确定受监控服务器的最关键问题的解决方案将具有重要的优势。

为了完全解决这个问题,可以通过公司内部的解决方案,或者将其外包给专业的第三方工具或服务来实现。本文将探讨这两种不同的方法,并分析在预算范围内扩展服务器监控的最佳方法。

在这个分析中,我们将看到每种方法如何处理以下指标的监控。这不是详尽无遗的列表,但包括了大多数IT部门想要监控的常见且有用的指标。

    • Requests per second (Average Load)

 

    • Average response time

 

    • Server error rates

 

    • Peak response time

 

    • Total server uptime

 

    • Average CPU utilization

 

    • Thread counts

 

    • Memory utilization

 

    Disk I/O rates

自社开发的服务器监视的优点和缺点

正如前所述,服务器监控也可以通过内部处理来进行。请参考以下内容。

    1. 列出并选择用于服务器监视的特定解决方案。我认为可以考虑到一些受欢迎的本地版服务器监视解决方案,如Prometheus、Grafana和Nagios。或者,如果使用来自虚拟主机或云服务器的服务器,则可以使用云服务提供商的服务器监视解决方案,例如AWS的CloudWatch。由于这些解决方案通常具有复杂的性质,因此在初始设置和配置阶段,您可能需要寻求外部咨询顾问或供应商的支持,请注意。

服务器监视需要经过充分培训和具备知识的IT工程师来进行。因此,您需要培训公司内部的IT员工或招聘具有相关经验的工程师来进行服务器监视。

然而,由于上述原因,处理监视的IT工程师需要具备冗余性,所以如果他们离职或突然无法使用,那么您将需要替代的备份人员。请记住,公司内部服务器监视是“IT工程师团队”。

您需要准确定义要监视的度量标准并将其限定在特定的服务器上。这当然需要对服务器以及其上运行的应用程序和服务有全面的了解。例如,磁盘IO和服务器的运行时间可能比群集化的Web服务器更重要,而CPU线程数可能与托管JavaScript中间件应用程序的服务器相关性更高,而不是托管前端应用程序的服务器。

也许您在阅读以上内容后已经注意到,在公司内部监控服务器不仅需要考虑实际使用软件的费用,也需要考虑IT工程师的人力资源方面,这样很容易变得非常昂贵。此外,还有可能产生一次性费用和定期相关费用,例如购买新服务器来托管服务器监控解决方案、培训IT工程师、额外咨询服务等,需要理解无论如何都会变得高昂。

此外,如果进行了如此巨额的投资,其弊端在于一旦设立起来,至少在未来几年内会被束缚于公司内部解决方案。这意味着,如果发现所选择的解决方案并非最佳,就很难改变下一步的行动,导致在不适合的选择中陷入困境。

考虑到这些事实,内部服务器监控并不是一个理想的解决方案。对于规模庞大的IT部门或强制性需要使用内部解决方案的组织来说,通常出于安全原因,最好将其委托给与防御相关的承包商或高安全性的生物技术公司。这样可以避免内部解决方案的成本和麻烦。

3. 替代社內伺服器監控方案(外包服务)

我们将详细研究一些云监控解决方案,作为内部服务器监视的替代方案。

亚马逊云监控

目前,AWS的監視解決方案之一是CloudWatch。對於在AWS平台上托管服務器的用戶來說,CloudWatch是一個明顯的解決方案。然而,對於將服務器基礎架設完全在AWS上的用戶來說,CloudWatch也有三個主要限制。

    1. 首先,CloudWatch可能会非常昂贵。特别是当有大量服务器或每个服务器都有几个指标时,成本就会很高。根据CloudWatch的定价页面所述,仅监视10台服务器实例上的7个标准指标,每月需支付约21美元。而且,这还不包括API请求、自定义指标和日志存档,如果要监视它们,成本将进一步增加。

其次,AWS(以及其他许多专有云平台)故意使服务一旦开始使用就很难从其生态系统中脱离。假设使用CloudWatch,现在想将服务器实例和监视功能迁移到新的云提供商。目前,只能手动迁移或使用自定义的第三方迁移解决方案才能完成。但是,为什么会这样呢?归根结底,Linux服务器实例及其指标在AWS、Microsoft Azure和Google云平台上完全相同。对于考虑迁移到云提供商的IT部门来说,供应商锁定的可能性是一个大问题。为了对抗这一点,MetricFire开发了集成功能,以更有效地利用AWS用户的AWS数据。

最后,AWS的CloudWatch仅适用于在AWS上拥有服务器的情况。如果没有服务器,需要检查安装和配置列表以在本地服务器上安装代理。

稍后解释,MetricFire的监控解决方案是设计来克服这些限制的。

MetricFire
指标火

MetricFire是一个将Prometheus、Graphite和Grafana结合在一起的托管服务。MetricFire提供了完整的基础设施和应用程序监控平台,用于收集、存储和可视化来自各种来源的时间序列数据。MetricFire的监控平台完全托管在云端,并且监控代理可以部署在本地和云服务器上。

MetricFire的支持工程师将随时为您提供有关警报设计、分析和监控的支持。此外,我们还提供全功能的Web UI,可以直接在平台上发送指标并可视化数据。使用GitHub、PagerDuty、Slack、Heroku、CircleCI等插件,您还可以扩展产品功能。

作为代表性的用例,可以提到对服务器、应用程序、IT网络和其他基础设施进行监控。MetricFire的最大优势在于其价格。正如[价格页面](https://www.metricfire.com/pricing)所述,MetricFire的监控解决方案的成本约为Datadog的四分之一,并且由于捆绑了多个服务和功能,与CloudWatch相比也更具有实惠性。

与上述的监控平台相比,MetricFire具有以下的额外功能和独特功能。

    • 実際のセットアップに基づいた、適切な階層化された顧客プラン。New RelicやDatadogなどが提供している1つまたは2つの厳格な顧客層とは異なり、MetricFireでは、個人向けのベーシックプラン(月額85ドル)から、成長するチーム向けのラージプラン(月額1599ドル)、プレミアムアニュアルプラン(月額3849ドル)、エンタープライズプランまで、7つ以上の明確に区分されたプランを提供しています。

 

    • 24時間365日のカスタマーサポートを提供しています。New Relicの標準プランでは8時から5時までのサポートしか提供しておらず、24時間365日のサポートを提供しているのはプレミアムプランや上級プランのお客様のみとなっていますので、その凄さが分かると思います。

 

    • 常にオープンソースの理念を採用しているため、お客様のデータは常にお客様のものであり、ベンダーにロックインされる危険性はありません。

 

    • データロケーションの選択 – お客様のデータは、最も便利で最も近いデータセンターでホスティングすることができます。

 

    コミュニティダッシュボード: MetricFireがホストするGrafanaのようなコミュニティソースのダッシュボードは、Datadogが独自に開発したダッシュボードのように、企業内の小さなチームが開発したものよりも、常にリッチで優れたものとなります。さらに、MetricFireのカスタマーサポートチームがいつでもダッシュボードのカスタマイズをサポートしてくれます。

Grafana实验室

Grafana是一个用于执行分析和监控的在线开源工具。Grafana可以整合多个数据源,创建出卓越的仪表盘。特别适用于比较和分析较长时间段的趋势和指标。

然而,Grafana是一个复杂的工具,对于初学者来说可能会感到非常困惑。因此,MetricFire的客户支持能够提供帮助。MetricFire的托管Grafana解决方案可在所有MetricFire套餐中使用。

Grafana Labs为满足服务器监控需求而提供商业私有解决方案,以支持引入和使用Grafana。根据需求,提供了两种解决方案。Grafana Cloud面向小型用户群体,其中包含专用Grafana实例,并支持Prometheus和Graphite两种工具。

Grafana Cloud的价格设置如下:标准版(含30天免费试用)每月49美元起,Pro版为定制价格。Grafana Enterprise专为希望进一步利用Grafana堆栈,包括Prometheus和Graphite后端的大型组织设计。请点击这里了解更多关于这些解决方案的详细信息。

Datadog –> 数据狗

Datadog是一款基于云计算的基础设施和应用程序监控工具。主要用于需要监控云端各种工具和服务的环境,覆盖从网络到系统、服务器的监控。通过与200多个工具和服务的集成,Datadog可以轻松监控技术栈的所有组件。同时,它还包括一个方便的记录器,可以使用API或单一指标来创建定义不易简化的自定义测试。与Grafana Lab类似,这款产品的复杂性可能需要一段时间来适应。

Datadog最初是作为一项更简洁的云基础设施监控服务启动,提供仪表盘、警报和指标可视化。随着云计算的普及,Datadog迅速发展,并扩大了产品范围以涵盖Amazon Web Services(AWS)、Microsoft Azure、Google Cloud Platform、Red Hat OpenShift、OpenStack等服务提供商。最近,Datadog还推出了应用程序监控服务,可与PagerDuty、Slack等应用程序集成以接收通知。

Datadog提供免费服务针对5个主机(仅数据保留1天),并提供为期14天的免费试用。之后,客户将按照每台主机15美元/月进行计费,网络性能计费为每台主机5美元/月。日志管理按照每百万个日志事件收费1.27美元/月,安全监测按照分析的日志数据量每GB收费0.20美元/月。Datadog更新后的价格可以在网站上查阅,但Datadog的定价明显偏高,特别是对于广泛监测指标的情况。

新瑞格

作为取代Grafana和Datadog的另一个选择,New Relic在实时事件监控方面尤为出色,可为托管Web服务器、游戏服务等实时应用程序的IT部门和组织提供帮助。此外,New Relic还提供预先配置的仪表板,以支持包括亚马逊云服务、微软Azure和谷歌云平台在内的各种云平台及其集成。

还可以使用New Relic的集成SDK来构建自定义集成。然而,这种集成的文档说明有些笨拙,不是每个人都能轻松设置。可以说,与主要竞争对手相比,New Relic的常规文档和前端UI也不够精致。

价格包括30天免费试用,之后可购买每月14.40美元的Pro版本,该版本包括13个月的数据保存和最高2275个集成事件。此外,New Relic在价格设置页面上仅提到“为在高度动态环境下的客户提供灵活的价格选项”。

总结

MetricFire是一个非常实惠的完整监控解决方案,与许多竞争对手的替代产品相比,在用户关心的领域表现出色。MetricFire集成了许多数据源,包括AWS和Azure等主要提供商。使用MetricFire,您可以监视整个系统栈发送的数据,而不仅仅是基础设施。请查看MetricFire的演示,注册免费试用账户来试用一下。

那么,下一篇文章吧!

广告
将在 10 秒后关闭
bannerAds