如何监视Linux系统资源的使用情况

如何监视Linux系统资源的使用情况,第1张

如何监视Linux系统资源的使用情况

虚拟终端 命令 free

命令

可以用百度搜索

你值得拥有:25 个 Linux 性能监控工具

里面有一些其它的好工具。

命令、uptime、free

参看::wenku.baidu./link?url=kExcj6W2dhzD6d4UzUW1td4NoIyghYMp3IHo2D8-kNIl0RzwFlR6kahsL6peg8mNWZ6pLaLSwKsaU5PB96MPAoBVu7L_YXSztvNvIykFJ_C

Linux *** 作系统也会有闹脾气的时候。在某些情况下,其系统的资源使用率(包括CPU或者内存),也会达到90%以上甚至更多。为此系统管理员在必要的时候,仍然需要监视系统资源的使

虽然说Linux *** 作系统要比Windows *** 作系统稳定的多。但是这个稳定是相对而言的。也就是说,Linux *** 作系统也会有闹脾气的时候。在某些情况下,其系统的资源使用率(包括CPU或者内存),也会达到90%以上甚至更多。为此系统管理员在必要的时候,仍然需要监视系统资源的使用情况。笔者今天就给大家介绍一下,在Linux *** 作系统下如何监视这个系统资源,做到心中有数。

在Windows *** 作系统中,可以通过任务管理器来查询各个进程所占用的CPU与内存的比率。在Linux *** 作系统中没有这种图形化的管理。在命令行模式下,键入命令,即可以看到各个进程所占用的系统资源。

ppp作为一个合格的系统管理员,出于系统性能优化或者其他方面的考虑,往往需要掌握系统中最消耗CPU或者内存资源的程序。为了达到这个目的,系统管理员就需要借助系统提供的命令。这个命令可以帮助管理员监控系统资源的使用情况,包括内存、CPU、交换文件分区的使用率等等。就是这个命令的执行结果。系统管理员想要提升 *** 作系统的性能,第一步就是需要读懂上面这张表格。如果这种图中的内容系统管理员无法看懂,那么他就想提升系统的性能根本无法入手。

Top命令的运行结果大致可以分为两个部分。上半部是使一些统计的信息,包括内存和交换分区的使用情况、CPU的运行情况、进程的总数等等。在这些统计信息中,系统管理员除了要关注这些重要资源的使用滤外,还需要注意进程运行的状态。可见在Linux系统中进程的状态主要有四种,分别为running、sleeping、sped和zombie。如果从系统维护与性能优化考虑,则系统管理员需要关注那些状态为zombie的进程。若进程处于这个状态,在Linux *** 作系统中叫做僵尸进程。什么叫做僵尸进程呢?就是那些父进程还没死、但是子进程却死了的进程。在Linux *** 作系统中,进程一般分为父进程和子进程。某个进程A可能会调用另外一个进程B。此时这个进程A就叫做父进程,而进程B就叫做子进程。由于一些意外的情况,子进程运行已经停止,但是父进程却还不知道子进程早已停止运行,还在那边傻傻的等待着子进程返回运行结果。由于子进程没有返回结果,则父进程可能一直会在那边等待。从而导致系统性能的下降。如果系统管理员发现有僵尸进程的话,首先要做的就是结束父进程(有时候还需要查看这个父进程打开的其他子进程运行情况),以释放其占用的系统资源。其次如果这种情况发生的比较频繁时,则系统管理员就需要分析到底是什么原因导致这种情况发生的。找到原因后要采取积极的措施。通常情况下,如果子进程的状态为僵尸时,父进程就不会自动结束,从而其占用的系统资源就不会自动释放,从而降低 *** 作系统的性能。

二、Top命令的使用技巧。

1、 选择合适的排序顺序。

在Windows *** 作系统的任务管理器中,管理员可以根据需要选择合适的排序顺序,如按CPU排序或者按内存的使用率进行排序。而在命令的显示结果中,默认情况下是按照CPU的使用率来进行排序的。如果现在系统管理员想按照内存使用率来排序,该如何处理呢?如果要想改变命令结果的排序顺序,则可以按m键来按内存进行排序。注意这里的m是小写,而不是大写的。在Linux *** 作系统中大部分命令与参数大小写都是敏感的。这跟微软 *** 作系统中的DOS命令不同。Dos命令是不区分大小写的。虽然这个排序没有像微软 *** 作系统中的任务管理器那么方便,只需要点点鼠标就可以完成排序。但是只要熟悉相关的命令,在命令行中对其排序没有大家想想的那么困难。

2、 监视特定用户使用的资源情况。

在Windows *** 作系统中,如果想要查看特定帐户所打开的进程以及所耗用的系统资源, *** 作非常简单。只需要打开系统任务管理器,然后按照用户来进行排序。就可以知道某个用户开启了哪些进程以及所占用的比例。而在命令中,没有按帐户进行排序的功能。即在上面这个显示结果中,只可以按照内存使用率或者CPU负载来进行排序,而无法按照用户来进行排序。在同一个结果中夹杂着系统特权用户root与普通用户所打开的进程。这对于系统管理员查找问题原因非常的不方便。有时候系统管理员往往需要只查看特定用户的进程,如只需要查看oracle帐户所打开的进程以及所占用的系统资源。而忽略掉系统帐户。因为特权帐户其他用户无权进行登陆 *** 作,而其运行的往往是一些系统级别的进程,为此一般不会出现问题。而普通用户可以运行一些应用程序。有时候他们糊里糊涂可能会打开一些非法程序,占用大量的系统资源,从而降低系统性能。废话少说,如何才能够查看特定帐户所启动的进程呢?其实很简单。现运行 命令,让系统统计所有帐户的进程。然后在需要查看特定帐户的进程使,只需要按u键(注意小写),然后输入用户名即可。此时系统会自动把其他帐户的进程过滤掉,方便系统管理员查看。按用户过滤后,仍然可以按m键来对现实的结果进行过滤。如果在一开始就需要查看某个特定用户的进程,那么只需要直接在 命令后面加入-u可选项然后带上具体的用户名即可。但是,此时如果再想查看全部用户的话,那么只有先推出命令,然后再利用命令不带任何选项,来查看所有用户的进程。或者说,再在这个窗口中输入字符u,然后直接按回车键,也可以显示所用用户的进程信息。

3、动态统计信息。

使用命令来统计进程的运行信息,跟微软 *** 作系统的任务管理器一样,都是动态调整的。也就是说,系统会每隔一段时间去统计这个信息,然后动态的显示在窗口中。不需要用户手工去更新相关的信息。而且从上面的图形中可以看出,命令统计的信息要比微软任务管理器统计的信息要多的多。所以对系统管理员来说,具有更大的参考价值。笔者以前也很喜欢采用微软 *** 作系统的任务管理器。而了解了命令后,就对其钟爱有加了。因为其不仅可以完成任务管理器中的所有功能。而且命令中有的信息在微软任务管理器中却无法显示。而这些信息往往对我们维护系统、提升性能具有很大的参考价值。

4、删除有异常的进程。

如果这个窗口中,发现某些进程有异常或者用户执行了规定以外的应用程序,如占用了太多的系统资源或者有僵尸进程的存在,则可以直接在这个窗口中讲其删除。 *** 作的方法很简单,只需要在这个窗口内输入字符p,然后系统会提示系统管理员输入要关闭进程的PID。管理员只需要键入这个值,然后按回车键就可以杀掉不需要的进程。不过在关闭进程的时候,有权限的限制。系统特权帐户root可以关闭所有用户的进程。而普通帐户则只能够删除自己打开的程序,而无法关闭其他用户的进程。如现在系统管理员先以oracle用户登录,发现root帐户下某个进程异常,想要关闭时,系统会提示无法关闭的错误信息。此时管理员必须先终止这个进程,然后利用su命令更改登陆的帐户。然后再关闭这个异常的进程。系统管理员可以同时关闭多个进程。方法很简单,就是同时输入多个需要关闭的进程号。在各个进程号之间需要利用逗号隔开。

在系统维护中是一个很有用的命令。除了可以实现如上的功能外,还可以设置其动态更新的时间间隔等等。不过需要注意的是,在不同版本的 Linux系统中其功能稍有差异,而且其显示的布局与内容也有所不同。为此当系统管理员维护其不怎么熟悉的版本时,有时候需要查看系统的帮助说明。此时只需要在命令后面加上?号就可以获得相关的帮助。这个联机帮助文档根命令一样,都是系统管理员的好帮手。不过可惜的是,现在这些在线帮助文档都是英文的。所以这对系统管理员的英文说明要求比较高。

Linux系统下如何监视系统资源使用率求解答

但是这个稳定是相对而言的。也就是说,Linux *** 作系统也会有闹脾气的时候。在某些情况下,其系统的资源使用率(包括CPU或者内存),也会达到90%以上甚至更多。为此系统管理员在必要的时候,仍然需要监视系统资源的使

虽然说Linux *** 作系统要比Windows *** 作系统稳定的多。但是这个稳定是相对而言的。也就是说,Linux *** 作系统也会有闹脾气的时候。在某些情况下,其系统的资源使用率(包括CPU或者内存),也会达到90%以上甚至更多。为此系统管理员在必要的时候,仍然需要监视系统资源的使用情况。笔者今天就给大家介绍一下,在Linux *** 作系统下如何监视这个系统资源,做到心中有数。

在Windows *** 作系统中,可以通过任务管理器来查询各个进程所占用的CPU与内存的比率。在Linux *** 作系统中没有这种图形化的管理。在命令行模式下,键入命令,即可以看到各个进程所占用的系统资源。

ppp作为一个合格的系统管理员,出于系统性能优化或者其他方面的考虑,往往需要掌握系统中最消耗CPU或者内存资源的程序。为了达到这个目的,系统管理员就需要借助系统提供的命令。这个命令可以帮助管理员监控系统资源的使用情况,包括内存、CPU、交换文件分区的使用率等等。就是这个命令的执行结果。系统管理员想要提升 *** 作系统的性能,第一步就是需要读懂上面这张表格。如果这种图中的内容系统管理员无法看懂,那么他就想提升系统的性能根本无法入手。

Top命令的运行结果大致可以分为两个部分。上半部是使一些统计的信息,包括内存和交换分区的使用情况、CPU的运行情况、进程的总数等等。在这些统计信息中,系统管理员除了要关注这些重要资源的使用滤外,还需要注意进程运行的状态。可见在Linux系统中进程的状态主要有四种,分别为running、sleeping、sped和zombie。如果从系统维护与性能优化考虑,则系统管理员需要关注那些状态为zombie的进程。若进程处于这个状态,在Linux *** 作系统中叫做僵尸进程。什么叫做僵尸进程呢?就是那些父进程还没死、但是子进程却死了的进程。在Linux *** 作系统中,进程一般分为父进程和子进程。某个进程A可能会调用另外一个进程B。此时这个进程A就叫做父进程,而进程B就叫做子进程。由于一些意外的情况,子进程运行已经停止,但是父进程却还不知道子进程早已停止运行,还在那边傻傻的等待着子进程返回运行结果。由于子进程没有返回结果,则父进程可能一直会在那边等待。从而导致系统性能的下降。如果系统管理员发现有僵尸进程的话,首先要做的就是结束父进程(有时候还需要查看这个父进程打开的其他子进程运行情况),以释放其占用的系统资源。其次如果这种情况发生的比较频繁时,则系统管理员就需要分析到底是什么原因导致这种情况发生的。找到原因后要采取积极的措施。通常情况下,如果子进程的状态为僵尸时,父进程就不会自动结束,从而其占用的系统资源就不会自动释放,从而降低 *** 作系统的性能。

二、Top命令的使用技巧。

1、 选择合适的排序顺序。

在Windows *** 作系统的任务管理器中,管理员可以根据需要选择合适的排序顺序,如按CPU排序或者按内存的使用率进行排序。而在命令的显示结果中,默认情况下是按照CPU的使用率来进行排序的。如果现在系统管理员想按照内存使用率来排序,该如何处理呢?如果要想改变命令结果的排序顺序,则可以按m键来按内存进行排序。注意这里的m是小写,而不是大写的。在Linux *** 作系统中大部分命令与参数大小写都是敏感的。这跟微软 *** 作系统中的DOS命令不同。Dos命令是不区分大小写的。虽然这个排序没有像微软 *** 作系统中的任务管理器那么方便,只需要点点鼠标就可以完成排序。但是只要熟悉相关的命令,在命令行中对其排序没有大家想想的那么困难。

2、 监视特定用户使用的资源情况。

在Windows *** 作系统中,如果想要查看特定帐户所打开的进程以及所耗用的系统资源, *** 作非常简单。只需要打开系统任务管理器,然后按照用户来进行排序。就可以知道某个用户开启了哪些进程以及所占用的比例。而在命令中,没有按帐户进行排序的功能。即在上面这个显示结果中,只可以按照内存使用率或者CPU负载来进行排序,而无法按照用户来进行排序。在同一个结果中夹杂着系统特权用户root与普通用户所打开的进程。这对于系统管理员查找问题原因非常的不方便。有时候系统管理员往往需要只查看特定用户的进程,如只需要查看oracle帐户所打开的进程以及所占用的系统资源。而忽略掉系统帐户。因为特权帐户其他用户无权进行登陆 *** 作,而其运行的往往是一些系统级别的进程,为此一般不会出现问题。而普通用户可以运行一些应用程序。有时候他们糊里糊涂可能会打开一些非法程序,占用大量的系统资源,从而降低系统性能。废话少说,如何才能够查看特定帐户所启动的进程呢?其实很简单。现运行 命令,让系统统计所有帐户的进程。然后在需要查看特定帐户的进程使,只需要按u键(注意小写),然后输入用户名即可。此时系统会自动把其他帐户的进程过滤掉,方便系统管理员查看。按用户过滤后,仍然可以按m键来对现实的结果进行过滤。如果在一开始就需要查看某个特定用户的进程,那么只需要直接在 命令后面加入-u可选项然后带上具体的用户名即可。但是,此时如果再想查看全部用户的话,那么只有先推出命令,然后再利用命令不带任何选项,来查看所有用户的进程。或者说,再在这个窗口中输入字符u,然后直接按回车键,也可以显示所用用户的进程信息。

3、动态统计信息。

使用命令来统计进程的运行信息,跟微软 *** 作系统的任务管理器一样,都是动态调整的。也就是说,系统会每隔一段时间去统计这个信息,然后动态的显示在窗口中。不需要用户手工去更新相关的信息。而且从上面的图形中可以看出,命令统计的信息要比微软任务管理器统计的信息要多的多。所以对系统管理员来说,具有更大的参考价值。笔者以前也很喜欢采用微软 *** 作系统的任务管理器。而了解了命令后,就对其钟爱有加了。因为其不仅可以完成任务管理器中的所有功能。而且命令中有的信息在微软任务管理器中却无法显示。而这些信息往往对我们维护系统、提升性能具有很大的参考价值。

4、删除有异常的进程。

如果这个窗口中,发现某些进程有异常或者用户执行了规定以外的应用程序,如占用了太多的系统资源或者有僵尸进程的存在,则可以直接在这个窗口中讲其删除。 *** 作的方法很简单,只需要在这个窗口内输入字符p,然后系统会提示系统管理员输入要关闭进程的PID。管理员只需要键入这个值,然后按回车键就可以杀掉不需要的进程。不过在关闭进程的时候,有权限的限制。系统特权帐户root可以关闭所有用户的进程。而普通帐户则只能够删除自己打开的程序,而无法关闭其他用户的进程。如现在系统管理员先以oracle用户登录,发现root帐户下某个进程异常,想要关闭时,系统会提示无法关闭的错误信息。此时管理员必须先终止这个进程,然后利用su命令更改登陆的帐户。然后再关闭这个异常的进程。系统管理员可以同时关闭多个进程。方法很简单,就是同时输入多个需要关闭的进程号。在各个进程号之间需要利用逗号隔开。

在系统维护中是一个很有用的命令。除了可以实现如上的功能外,还可以设置其动态更新的时间间隔等等。不过需要注意的是,在不同版本的 Linux系统中其功能稍有差异,而且其显示的布局与内容也有所不同。为此当系统管理员维护其不怎么熟悉的版本时,有时候需要查看系统的帮助说明。此时只需要在命令后面加上?号就可以获得相关的帮助。这个联机帮助文档根命令一样,都是系统管理员的好帮手。不过可惜的是,现在这些在线帮助文档都是英文的。所以这对系统管理员的英文说明要求比较高。

我想监视linux系统的内存使用情况,在linux下有哪

[root@iZ259r7h4pfZ ~]#

- 16:48:24 up 226 days, 8:34, 1 user, load average: 0.00, 0.00, 0.01

Tasks: 204 total, 1 running, 164 sleeping, 0 sped, 39 zombie

Cpu(s): 0.9%us, 0.9%sy, 0.0%ni, 98.1%id, 0.0%wa, 0.0%hi, 0.0%si, 0.0%st

Mem: 1920740k total, 1123552k used, 797188k free, 24216k buffers

Swap: 0k total, 0k used, 0k free, 87436k cached

[root@iZ259r7h4pfZ ~]# free -m

total used free shared buffers cached

Mem: 1875 1097 778 0 23 85

-/+ buffers/cache: 988 887

Swap: 0 0 0

也可以用watch监控

[root@iZ259r7h4pfZ ~]# watch -n 1 "free -m"

Every 1.0s: free -m Tue Oct 31 16:48:44 2017

total used free shared buffers cached

Mem: 1875 1098 777 0 23 85

-/+ buffers/cache: 989 886

Swap: 0 0 0

LoadRunner如何监控Linux系统资源

这个需要配置吧

:blogs./yangxia-test/archive/2012/11/27/2790771.

怎样使用loadrunner监控linux系统资源

LR只是模拟客户端和服务器进行交互,并不能直观的收集服务器是内部的信息,如果要监控服务器性能情况,linux系统可以用nmon(或者用命令不过,只能监控内存之类的情况,写一个shell脚本定时输出日志到本地就可以了),oracle可以用awr。

如何查看linux资源使用情况

Linux查看系统资源占用

在系统维护的过程中,随时可能有需要查看 CPU和内存的使用率,并根据相应信息分析系统状况的需求。本文介绍一下几种常见的Linux系统资源查看命令。

1、总体内存占用的查看

命令:free

图1 free命令查看内存占用

(1) free命令默认是以kb为单位显示的,可以用free -m 用Mb单位来显示。

(2) Mem行 : total = used + free 其中buffers和cached虽然计算在used内, 但其实为可用内存。

(3) Mem下一行:used为真实已占内存,free为真实可用内存。

(4)Swap:内存交换区的使用情况。

2、查看内存占用前五的进程

命令:ps auxw | head -1ps auxw|sort -rn -k4|head -5

图 2.1查看内存占用前5的进程

如图2.1所示, 内存的单位是kb,VSZ是虚拟内存的占用,RSS是真实的内存的占用。

命令分解:

ps auxw显示系统资源占用情况;

head -1表示显示第一列,即标题列;

sort -r 表示反向排序,-n表示按数字排序,-k4表示列的第4个字符。

3、查看CPU占用前三的进程

命令:ps auxw|head -1ps auxw|sort -rn -k3|head -3

图3.1 查看cpu占用前三的进程

该命令与图2.1相仿,只是选择的资源占用情况的第3列(即cpu),用“-k3”表示。

4、查看系统整体的负载

命令:

图4.1 显示系统整体负载

(1)第一行: 系统时间 + 系统运行时间 + 几个用户 + 1/5/15分钟系统平均负载

(2)第二行:进程总数(total) + 正在运行进程数(running) + 睡眠进程数(sleeping) + 停止的进程数(sped)+ 僵尸进程数(zombie)

(3)第三行:用户空间CPU占比(us) + 内核空间CPU占比(sy)+ CPU空置率(id)

图4.2 各个任务占用资源情况

注解:

PID :进程ID

USER :用户名

PR :优先级

NI :负值表示高优先级,正值表示低优先级。

VIRT :虚拟内存

RES : 真实内存

SHR :共享内存

S :进程状态 D=不可中断的睡眠状态; R=运行; S=睡眠 ;T=跟踪/停止; Z=僵尸进程

参数:

-d 2 :每隔2秒显式所有进程的资源占用情况

-c :每隔5秒显式进程的资源占用情况,并显示进程的命令行参数(默认只有进程名)

-p 12345 -p 6789:每隔5秒显示pid是12345和pid是6789的两个进程的资源占用情况

-d 2 -c -p 123456 :每隔2秒显示pid是12345的进程的资源使用情况,并显式该进程启动的命令行参数

如何使用vmstat命令监视 CPU 的使用情况

假设一个线程被调度运行,它将一直运行直到它的时间片用完、直到被抢先或直到它自己主动放弃 CPU 控制权。

当另一个线程被赋予 CPU 控制权时,必须保存前一个线程的上下文或工作环境,并载入当前线程的上下文。 *** 作系统有一个很有效的上下文切换过程,所以每次切换并不耗费资源。

任何上下文切换的显著增加,如当 cs 比磁盘 I/O 和网络包速率高的多,都应进行进一步调查。

安装程序应该会创建一个motion群组和用户,并且将motion用户添加到video群组。要是安装程序没有创建motion群组和用户,那么你必须自行创建。还要自行添加到video群组,才能避开烦人的权限问题。

现在运行motion,看看它是否管用:

$ sudo motion [0] Processing thread 0 - config file /etc/motion/motion.conf [0] Motion 3.2.12 Started [0] ffmpeg LIBAVCODEC_BUILD 3547904 LIBAVFORMAT_BUILD 3544067 [0] Thread 1 is from /etc/motion/motion.conf [1] Thread 1 started [0] motion-httpd/3.2.12 running, accepting connections [1] Failed to open video device /dev/video0: No such file or directory [0] motion-httpd: waiting for data on port TCP 8080 [1] Could not fetch initial image from camera [1] Motion continues using width and height from config file(s) [1] Resizing pre_capture buffer to 1 items [1] Started stream webcam server in port 8081 [...]

它会显示好多好多行,直到你看到如下内容:

[1] Failed to open video device /dev/video0: No such file or directory [1] Video signal lost - Adding grey image

将你的Web浏览器指向localhost:8081,你会看到一幅灰色图像:

图2:如果Motion找不到摄像头,就会显示灰色图像。

这很好,因为这表明Motion已正确安装;你要做的就是对它进行配置。按Ctrl+C组合键停止运行。然后,在你的主目录下创建一个.motion目录,将默认配置文件拷贝到该目录中,并将所有权改成归你所有:

~$ mkdir .motion ~$ sudo cp /etc/motion/motion.conf .motion/ ~$ sudo chown carla:carla .motion/motion.conf

你还需要用来存储motion所拍摄图像的一个目录:

~$ mkdir motion-images

当你启动Motion后,它会寻找配置文件,先在当前目录下寻找,然后在~/.motion下寻找,最后在/etc/motion下寻找。现在,编辑你的~/.motion/motion.conf文件――该例子包括基本配置以及与我的Foscam IP摄像头相关的那些行:

# 在守护程序(后台)模式下启动,打2开终端(默认:off) daemon on # 检测到运动后,输出“正常”图片(默认:on) [...] output_normal off # 存储进程编号的文件,又叫pid文件。(默认:未定义)。 process_id_file /var/run/motion/motion.pid # 图像宽度(像素)。有效范围:取决于摄像头,默认:352个像素 width 640 # 图像高度(像素)。有效范围:取决于摄像头,默认:288个像素 height 480 # 每秒拍摄的最大帧数量。 # 有效范围:2-100。默认:100(几乎没有限制)。 framerate 7 # 如果你使用网络摄像头要使用的URL,尺寸将自动检测(包括http://、ftp://或file:///) # 必须是返回单JPEG图片或原始MJPEG流的URL。默认:未定义 netcam_url value http://http://192.168.10.250:8080/videostream.cgi # 网络摄像头的用户名和密码(只要在需要时)。默认:未定义 # 语法是用户:密码 netcam_userpass admin:mypassword # 存储图片和短片的目标基本目录 # 推荐使用的绝对路径。(默认值:当前工作目录) target_dir /home/carla/motion-images # ffmpeg用于视频压缩的编解码器。 [...] ffmpeg_video_codec mpeg4

你需要创建用来存储PID文件的目录,因为它在motion.conf中表明:

$ sudo mkdir /var/run/motion

现在再试着启动它:

$ sudo motion [0] Processing thread 0 - config file /home/carla/.motion/motion.conf [0] Motion 3.2.12 Started [0] Motion going to daemon mode

到目前为止很好,现在再试一下localhost:8081

Supervisor是一个C/S系统,它允许用户在类UNIX系统上控制一些进程。它具有以下特性:

1简单

Supervisor通过INI格式配置文件进行配置,很容易掌握,它为每个进程提供了很多配置选项,可以使你很容易的重启进程或者自动的轮转日志。

2统一

Supervisor提供了一种统一的方式来start、stop、monitor你的进程, 进程可以单独控制,也可以成组的控制。你可以在本地或者远程命令行或者web接口来配置Supervisor。

3有效

Supervisor通过fork/exec启动它的子进程,子进程并不是守护进程。当一个进程终止的时候, *** 作系统会立即给Supervisor发送一个信号,而不是像其他解决方案依赖PID文件。

4可扩展

Supervisor包含一个简单的事件通知协议,因此任何程序都可以监控它,而且提供一个XML-RPC控制接口。

5兼容

除了windows平台,其他平台都可运行。

Supervisor系统的组件:

supervisord:

服务会启动supervisord服务,它负责调用自己启动子程序,响应来自客户端的命令,重启crash或者退出的进程,记录进程的输出信息,收集事件信息。该服务的配置文件在/etc/supervisor/supervisord.conf

supervisorctl:

客户端的命令行工具,提供一个类shell接口,通过它你可以连接到不同的supervisord进程上来管理它们各自的子程序。客户端命令通过UNIX socket或者TCP来和服务通讯,服务端可以要求客户端提供身份验证之后才能进行 *** 作([supervisorctl])。

Web Server:

一个小的web接口被集成进了supervisorctl,重启supervisord之后就可以访问了([inet_http_server])。

XML-RPC Interface:

就像HTTP提供WEB UI一样,同时还提供了XML-RPC接口来控制supervisor和由它运行的程序。

安装:

supervisor是python编写的,显然用easy_install、pip都可以安装,我懒,直接apt-get了,在ubuntu14.04下安装完后版本是3.0b2。

Supervisor服务的启动

其实启动Supervisor很简单,supervisord -h看看就知道了,最简单的-c根配置文件即可:

复制代码

代码如下:

supervisord -- run a set of applications as daemons.

Usage: /usr/bin/supervisord [options]

Options:

-c/--configuration FILENAME -- configuration file

-n/--nodaemon -- run in the foreground (same as 'nodaemon true' in config file)

-h/--help -- print this usage message and exit

-v/--version -- print supervisord version number and exit

-u/--user USER -- run supervisord as this user (or numeric uid)

-m/--umask UMASK -- use this umask for daemon subprocess (default is 022)

-d/--directory DIRECTORY -- directory to chdir to when daemonized

-l/--logfile FILENAME -- use FILENAME as logfile path

-y/--logfile_maxbytes BYTES -- use BYTES to limit the max size of logfile

-z/--logfile_backups NUM -- number of backups to keep when max bytes reached

-e/--loglevel LEVEL -- use LEVEL as log level (debug,info,warn,error,critical)

-j/--pidfile FILENAME -- write a pid file for the daemon process to FILENAME

-i/--identifier STR -- identifier used for this instance of supervisord

-q/--childlogdir DIRECTORY -- the log directory for child process logs

-k/--nocleanup -- prevent the process from performing cleanup (removal of

old automatic child log files) at startup.

-a/--minfds NUM -- the minimum number of file descriptors for start success

-t/--strip_ansi -- strip ansi escape codes from process output

--minprocs NUM -- the minimum number of processes available for start success

--profile_options OPTIONS -- run supervisord under profiler and output

results based on OPTIONS, which is a comma-sep'd

list of 'cumulative', 'calls', and/or 'callers',

e.g. 'cumulative,callers')

不过既然我这懒人是用apt-get安装的,那安装包的规范必然符合debian系的风格了,直接service supervisor start即可启动,且慢,我们还没配置supervisor的配置文件呢,启动了也没什么效果。我们后面详解配置文件的配置。

supervisorctl客户端的使用

supervisorctl有两种模式,一种是交互模式,一种是命令行模式。在命令行输入supervisorctl直接回车,即可进入交互模式。

复制代码

代码如下:

supervisorctl -- control applications run by supervisord from the cmd line.

Usage: /usr/bin/supervisorctl [options] [action [arguments]]

Options:

-c/--configuration -- configuration file path (default /etc/supervisor.conf)

-h/--help -- print usage message and exit

-i/--interactive -- start an interactive shell after executing commands

-s/--serverurl URL -- URL on which supervisord server is listening

(default "http://localhost:9001").

-u/--username -- username to use for authentication with server

-p/--password -- password to use for authentication with server

-r/--history-file -- keep a readline history (if readline is available)

复制代码

代码如下:

action [arguments] -- see below

Actions are commands like "tail" or "stop". If -i is specified or no action is

specified on the command line, a "shell" interpreting actions typed

interactively is started. Use the action "help" to find out about available

actions.

Supervisor的开机自启动

如果你是pip或者easy_install安装的,开机服务自启动还真是个麻烦事,不过官方已经给出一些rc.d脚本示例了,在github上,不过由于我是apt-get安装的,显然这个开机自启动是不用担心的,用debian的update-rc.d即可搞定。

Supervisor的进程安全

既然是用Supervisor来保证其他进程的正常运行,但是万一Supervisor进程挂了怎么办,我们可以使用daemontools来保证Supervisor正常运行,就类似于监控的监控。

supervisord的配置文件主要由几个配置段构成,配置项以K/V格式呈现,下面就看看各个配置端需要怎样配置:

[unix_http_server]

在该配置块的参数项表示的是一个监听在socket上的HTTP server,如果[unix_http_server]块不在配置文件中,则不会启动基于socket的HTTP server。

file:一个unix domain socket的文件路径,HTTP/XML-RPC会监听在这上面

chmod:在启动时修改unix domain socket的mode

chown:修改socket文件的属主

username:HTTP server在认证时的用户名

password:认证密码<span style="font-family:'Microsoft YaHei'font-size:16pxline-height:1.5"></span>

eg:

复制代码

代码如下:

[unix_http_server]

file = /tmp/supervisor.sock

chmod = 0777

chown= nobody:nogroup

username = user

password = 123

[inet_http_server]

在该配置块的参数项表示的是一个监听在TCP上的HTTP server,如果[inet_http_server]块不在配置文件中,则不会启动基于TCP的HTTP server。

port:TCP监听的地址和端口(ip:port),这个地址会被HTTP/XML-RPC监听

username:HTTP server在认证时的用户名

password:认证密码

eg:

复制代码

代码如下:

[inet_http_server]

port = 127.0.0.1:9001

username = user

password = 123

[supervisord]

该配置块的参数项是关于supervisord进程的全局配置项。

logfile:log文件路径

logfile_maxbytes:log文件达到多少后自动进行轮转,单位是KB、MB、GB。如果设置为0则表示不限制日志文件大小

logfile_backups:轮转日志备份的数量,默认是10,如果设置为0,则不备份

loglevel:error、warn、info、debug、trace、blather、critical

pidfile:pid文件路径

umask:umask值,默认022

nodaemon:如果设置为true,则supervisord在前台启动,而不是以守护进程启动

minfds:supervisord在成功启动前可用的最小文件描述符数量,默认1024

minprocs:supervisord在成功启动前可用的最小进程描述符数量,默认200

nocleanup:防止supervisord在启动的时候清除已经存在的子进程日志文件

childlogdir:自动启动的子进程的日志目录

user:supervisord的运行用户

directory:supervisord以守护进程运行的时候切换到这个目录

strip_ansi:消除子进程日志文件中的转义序列

environment:一个k/v对的list列表

eg:

复制代码

代码如下:

[supervisord]

logfile = /tmp/supervisord.log

logfile_maxbytes = 50MB

logfile_backups=10

loglevel = info

pidfile = /tmp/supervisord.pid

nodaemon = false

minfds = 1024

minprocs = 200

umask = 022

user = chrism

identifier = supervisor

directory = /tmp

nocleanup = true

childlogdir = /tmp

strip_ansi = false

environment = KEY1="value1",KEY2="value2"

[supervisorctl]

该配置块参数是关于supervisorctl

serverurl:这个url是用来访问supervisord服务的(http://localhost:9001),或者是个sockets文件(unix:///absolute/path/to/file.sock)

username:supervisorctl连接supervisord的认证用户

password:认证密码

prompt:默认是supervisor

history_file:history文件路径

eg:

复制代码

代码如下:

[supervisorctl]

serverurl = unix:///tmp/supervisor.sock

username = chris

password = 123

prompt = mysupervisor

[program:x]

该配置块包含一个或者多个program段,program来表明supervisord要控制哪些程序。该配置块的头部是有固定格式的,一个关键字program,后面跟着一个冒号,接下来才是程序名。例如:[program:foo],foo就是程序名,在使用supervisorctl来 *** 作程序的时候,就是以foo来标明的。

command:启动程序使用的命令,可以是绝对路径或者相对路径

process_name:一个python字符串表达式,用来表示supervisor进程启动的这个的名称,默认值是%(program_name)s

numprocs:Supervisor启动这个程序的多个实例,如果numprocs>1,则process_name的表达式必须包含%(process_num)s,默认是1

numprocs_start:一个int偏移值,当启动实例的时候用来计算numprocs的值

priority:权重,可以控制程序启动和关闭时的顺序,权重越低:越早启动,越晚关闭。默认值是999

autostart:如果设置为true,当supervisord启动的时候,进程会自动重启。

autorestart:值可以是false、true、unexpected。false:进程不会自动重启,unexpected:当程序退出时的退出码不是exitcodes中定义的时,进程会重启,true:进程会无条件重启当退出的时候。

startsecs:程序启动后等待多长时间后才认为程序启动成功

startretries:supervisord尝试启动一个程序时尝试的次数。默认是3

exitcodes:一个预期的退出返回码,默认是0,2。

stopsignal:当收到stop请求的时候,发送信号给程序,默认是TERM信号,也可以是 HUP, INT, QUIT, KILL, USR1, or USR2。

stopwaitsecs:在 *** 作系统给supervisord发送SIGCHILD信号时等待的时间

stopasgroup:如果设置为true,则会使supervisor发送停止信号到整个进程组

killasgroup:如果设置为true,则在给程序发送SIGKILL信号的时候,会发送到整个进程组,它的子进程也会受到影响。

user:如果supervisord以root运行,则会使用这个设置用户启动子程序

redirect_stderr:如果设置为true,进程则会把标准错误输出到supervisord后台的标准输出文件描述符。

stdout_logfile:把进程的标准输出写入文件中,如果stdout_logfile没有设置或者设置为AUTO,则supervisor会自动选择一个文件位置。

stdout_logfile_maxbytes:标准输出log文件达到多少后自动进行轮转,单位是KB、MB、GB。如果设置为0则表示不限制日志文件大小

stdout_logfile_backups:标准输出日志轮转备份的数量,默认是10,如果设置为0,则不备份

stdout_capture_maxbytes:当进程处于stderr capture mode模式的时候,写入FIFO队列的最大bytes值,单位可以是KB、MB、GB

stdout_events_enabled:如果设置为true,当进程在写它的stderr到文件描述符的时候,PROCESS_LOG_STDERR事件会被触发

stderr_logfile:把进程的错误日志输出一个文件中,除非redirect_stderr参数被设置为true

stderr_logfile_maxbytes:错误log文件达到多少后自动进行轮转,单位是KB、MB、GB。如果设置为0则表示不限制日志文件大小

stderr_logfile_backups:错误日志轮转备份的数量,默认是10,如果设置为0,则不备份

stderr_capture_maxbytes:当进程处于stderr capture mode模式的时候,写入FIFO队列的最大bytes值,单位可以是KB、MB、GB

stderr_events_enabled:如果设置为true,当进程在写它的stderr到文件描述符的时候,PROCESS_LOG_STDERR事件会被触发

environment:一个k/v对的list列表

directory:supervisord在生成子进程的时候会切换到该目录

umask:设置进程的umask

serverurl:是否允许子进程和内部的HTTP服务通讯,如果设置为AUTO,supervisor会自动的构造一个url


欢迎分享,转载请注明来源:内存溢出

原文地址:https://54852.com/yw/7200866.html

(0)
打赏 微信扫一扫微信扫一扫 支付宝扫一扫支付宝扫一扫
上一篇 2023-04-02
下一篇2023-04-02

发表评论

登录后才能评论

评论列表(0条)

    保存