内存溢出后,服务器可能就打不开了,死机了。所以设置个程序监测内存占用状态,超出95%后,直接关掉那个最占用内存的进程。
在Ubuntu上设置一个守护进程来监控内存使用情况,并在内存超过90%时终止内存占用最多的进程,可以通过编写一个shell脚本和使用systemd
来实现。以下是详细的步骤和代码示例:
创建一个脚本文件,例如monitor_memory.sh
,其内容如下:
我在/root
中创建了。
bash#!/bin/bash
# 设置内存阈值为95%
MEMORY_THRESHOLD=95
while true; do
# 获取总内存和已用内存
TOTAL_MEM=$(free | grep Mem | awk '{print $2}')
USED_MEM=$(free | grep Mem | awk '{print $3}')
# 计算已用内存的百分比
MEMORY_USAGE=$(($USED_MEM * 100 / $TOTAL_MEM))
# 如果内存使用超过阈值,找到并终止占用内存最多的进程
if [ $MEMORY_USAGE -gt $MEMORY_THRESHOLD ]; then
echo "Memory usage is at $MEMORY_USAGE%, which is above the threshold of $MEMORY_THRESHOLD%."
TOP_PROCESS_INFO=$(ps -eo pid,comm,%mem,user --sort=-%mem | head -n 2 | tail -n 1)
TOP_PROCESS_PID=$(echo $TOP_PROCESS_INFO | awk '{print $1}')
TOP_PROCESS_USER=$(echo $TOP_PROCESS_INFO | awk '{print $4}')
TOP_PROCESS_MEM=$(echo $TOP_PROCESS_INFO | awk '{print $3}')
echo "Killing process $TOP_PROCESS_PID, owned by $TOP_PROCESS_USER, which is using $TOP_PROCESS_MEM% of memory."
kill -9 $TOP_PROCESS_PID
fi
# 每隔60秒检查一次
sleep 60
done
确保脚本具有可执行权限:
bashchmod +x monitor_memory.sh
在/etc/systemd/system/
目录下创建一个服务文件,例如memory_monitor.service
,其内容如下:
ini[Unit]
Description=Memory Monitor Service
After=network.target
[Service]
Type=simple
ExecStart=/root/monitor_memory.sh
Restart=on-failure
[Install]
WantedBy=multi-user.target
请将/path/to/your/monitor_memory.sh
替换为实际的脚本路径。
重新加载systemd
,启动并启用服务:
bashsudo systemctl daemon-reload
sudo systemctl start memory_monitor.service
sudo systemctl enable memory_monitor.service
使用以下命令检查服务状态:
bashsudo systemctl status memory_monitor.service
如果一切正常,服务应该会显示为“active (running)”。
这种方法会强制终止占用内存最多的进程,可能导致数据丢失或服务中断。请谨慎使用。
可根据需要调整脚本的检查频率和阈值。
可以在脚本中添加日志记录以便后续分析。
通过上述步骤,你就可以在Ubuntu上设置一个守护进程来监控内存使用情况,并在内存超过95%时终止占用最多的进程。
比如要将监控频率从每60秒一次改为每10秒一次,同时更新和重启服务,你需要进行以下修改和操作:
编辑之前创建的 monitor_memory.sh
脚本,将 sleep
时间从 60
秒改为 10
秒:
bash#!/bin/bash
# 设置内存阈值为95%
MEMORY_THRESHOLD=95
while true; do
# 获取总内存和已用内存
TOTAL_MEM=$(free | grep Mem | awk '{print $2}')
USED_MEM=$(free | grep Mem | awk '{print $3}')
# 计算已用内存的百分比
MEMORY_USAGE=$(($USED_MEM * 100 / $TOTAL_MEM))
# 如果内存使用超过阈值,找到并终止占用内存最多的进程
if [ $MEMORY_USAGE -gt $MEMORY_THRESHOLD ]; then
echo "Memory usage is at $MEMORY_USAGE%, which is above the threshold of $MEMORY_THRESHOLD%."
TOP_PROCESS_INFO=$(ps -eo pid,comm,%mem,user --sort=-%mem | head -n 2 | tail -n 1)
TOP_PROCESS_PID=$(echo $TOP_PROCESS_INFO | awk '{print $1}')
TOP_PROCESS_USER=$(echo $TOP_PROCESS_INFO | awk '{print $4}')
TOP_PROCESS_MEM=$(echo $TOP_PROCESS_INFO | awk '{print $3}')
echo "Killing process $TOP_PROCESS_PID, owned by $TOP_PROCESS_USER, which is using $TOP_PROCESS_MEM% of memory."
kill -9 $TOP_PROCESS_PID
fi
# 每隔10秒检查一次
sleep 10
done
保存并关闭文件。
执行以下命令重新加载 systemd
,然后重启并启用服务:
bashsudo systemctl daemon-reload sudo systemctl restart memory_monitor.service
使用以下命令检查服务状态:
bashsudo systemctl status memory_monitor.service
如果服务正常运行,它将显示为“active (running)”。
通过以上步骤,你将监控频率改为每10秒检查一次,并重启了服务。这样,守护进程将每10秒检查一次内存使用情况,并在内存超过阈值时终止占用最多的进程。
为了查看脚本中 echo
命令打印的日志信息,可以将其输出重定向到一个日志文件。可以在 monitor_memory.sh
脚本中添加日志记录,并确保 systemd
服务配置正确处理日志输出。以下是详细步骤:
编辑 monitor_memory.sh
脚本,添加日志记录功能。可以使用 logger
命令将信息写入系统日志,也可以将日志输出重定向到一个专用的日志文件。以下是两种方法:
logger
命令记录日志将 echo
命令替换为 logger
命令,将信息写入系统日志:
bash#!/bin/bash
# 设置内存阈值为95%
MEMORY_THRESHOLD=95
while true; do
# 获取总内存和已用内存
TOTAL_MEM=$(free | grep Mem | awk '{print $2}')
USED_MEM=$(free | grep Mem | awk '{print $3}')
# 计算已用内存的百分比
MEMORY_USAGE=$(($USED_MEM * 100 / $TOTAL_MEM))
# 如果内存使用超过阈值,找到并终止占用内存最多的进程
if [ $MEMORY_USAGE -gt $MEMORY_THRESHOLD ]; then
logger "Memory usage is at $MEMORY_USAGE%, which is above the threshold of $MEMORY_THRESHOLD%."
TOP_PROCESS_INFO=$(ps -eo pid,comm,%mem,user --sort=-%mem | head -n 2 | tail -n 1)
TOP_PROCESS_PID=$(echo $TOP_PROCESS_INFO | awk '{print $1}')
TOP_PROCESS_USER=$(echo $TOP_PROCESS_INFO | awk '{print $4}')
TOP_PROCESS_MEM=$(echo $TOP_PROCESS_INFO | awk '{print $3}')
logger "Killing process $TOP_PROCESS_PID, owned by $TOP_PROCESS_USER, which is using $TOP_PROCESS_MEM% of memory."
kill -9 $TOP_PROCESS_PID
fi
# 每隔10秒检查一次
sleep 10
done
将所有输出重定向到一个日志文件,例如 /var/log/memory_monitor.log
:
bash#!/bin/bash
# 设置内存阈值为95%
MEMORY_THRESHOLD=95
LOG_FILE="/var/log/memory_monitor.log"
while true; do
# 获取总内存和已用内存
TOTAL_MEM=$(free | grep Mem | awk '{print $2}')
USED_MEM=$(free | grep Mem | awk '{print $3}')
# 计算已用内存的百分比
MEMORY_USAGE=$(($USED_MEM * 100 / $TOTAL_MEM))
# 如果内存使用超过阈值,找到并终止占用内存最多的进程
if [ $MEMORY_USAGE -gt $MEMORY_THRESHOLD ]; then
echo "$(date): Memory usage is at $MEMORY_USAGE%, which is above the threshold of $MEMORY_THRESHOLD%." >> $LOG_FILE
TOP_PROCESS_INFO=$(ps -eo pid,comm,%mem,user --sort=-%mem | head -n 2 | tail -n 1)
TOP_PROCESS_PID=$(echo $TOP_PROCESS_INFO | awk '{print $1}')
TOP_PROCESS_USER=$(echo $TOP_PROCESS_INFO | awk '{print $4}')
TOP_PROCESS_MEM=$(echo $TOP_PROCESS_INFO | awk '{print $3}')
echo "$(date): Killing process $TOP_PROCESS_PID, owned by $TOP_PROCESS_USER, which is using $TOP_PROCESS_MEM% of memory." >> $LOG_FILE
kill -9 $TOP_PROCESS_PID
fi
# 每隔10秒检查一次
sleep 10
done
确保日志文件具有写入权限:
bashsudo touch /var/log/memory_monitor.log
sudo chmod 666 /var/log/memory_monitor.log
如果选择将日志输出重定向到文件,则需要确保 systemd
服务能够正确处理这些输出。在 /etc/systemd/system/memory_monitor.service
文件中,添加 StandardOutput
和 StandardError
选项:
ini[Unit]
Description=Memory Monitor Service
After=network.target
[Service]
Type=simple
ExecStart=/root/monitor_memory.sh
StandardOutput=append:/var/log/memory_monitor.log
StandardError=append:/var/log/memory_monitor.log
Restart=on-failure
[Install]
WantedBy=multi-user.target
执行以下命令重新加载 systemd
,然后重启并启用服务:
bashsudo systemctl daemon-reload sudo systemctl restart memory_monitor.service
根据你选择的日志记录方法,查看日志信息:
logger
命令)使用 journalctl
查看日志:
bashsudo journalctl -u memory_monitor.service
使用 cat
或 tail
命令查看日志文件:
bashcat /var/log/memory_monitor.log
# 或
tail -f /var/log/memory_monitor.log
通过以上步骤,你可以在监控脚本中记录日志,并使用 systemd
服务来管理和查看这些日志。
这个 systemd
服务单元文件定义了一个名为 memory_monitor.service
的服务,该服务运行一个用于监控内存使用情况的脚本。以下是各部分的详细解释:
[Unit]
部分Description=Memory Monitor Service
:描述该服务的功能,这里是“内存监控服务”。
After=network.target
:指定该服务应该在 network.target
之后启动。这意味着网络服务启动后才会启动该服务。
[Service]
部分Type=simple
:指定服务类型为 simple
,表示 ExecStart
选项启动的进程不会派生其他子进程,且不会进入后台。systemd
会认为该服务的主进程就是 ExecStart
启动的进程。
ExecStart=/root/monitor_memory.sh
:指定服务启动时执行的命令,即运行 /root/monitor_memory.sh
脚本。
StandardOutput=append:/var/log/memory_monitor.log
:将标准输出(即脚本中 echo
或其他标准输出的内容)追加到 /var/log/memory_monitor.log
文件中。
StandardError=append:/var/log/memory_monitor.log
:将标准错误输出(即脚本中错误信息的输出)追加到 /var/log/memory_monitor.log
文件中。
Restart=on-failure
:如果服务因为非零退出状态失败,则自动重启服务。这有助于确保服务在意外故障时重新启动。
[Install]
部分WantedBy=multi-user.target
:指定该服务应该在多用户目标下启动。multi-user.target
是一个常用的系统运行级别,类似于传统的运行级别 3(多用户模式,不带图形界面)。在Ubuntu上设置一个守护进程来监控内存使用情况,并在内存超过90%时终止内存占用最多的进程,可以通过编写一个shell脚本和使用systemd
来实现。以下是详细的步骤和代码示例:
创建一个脚本文件,例如monitor_memory.sh
,其内容如下:
我在vim /root/monitor_memory.sh
中创建了。
bash#!/bin/bash
# 设置内存阈值为95%
MEMORY_THRESHOLD=95
while true; do
# 获取总内存和已用内存
TOTAL_MEM=$(free | grep Mem | awk '{print $2}')
USED_MEM=$(free | grep Mem | awk '{print $3}')
# 计算已用内存的百分比
MEMORY_USAGE=$(($USED_MEM * 100 / $TOTAL_MEM))
# 如果内存使用超过阈值,找到并终止占用内存最多的进程
if [ $MEMORY_USAGE -gt $MEMORY_THRESHOLD ]; then
logger "Memory usage is at $MEMORY_USAGE%, which is above the threshold of $MEMORY_THRESHOLD%."
TOP_PROCESS_INFO=$(ps -eo pid,comm,%mem,user --sort=-%mem | head -n 2 | tail -n 1)
TOP_PROCESS_PID=$(echo $TOP_PROCESS_INFO | awk '{print $1}')
TOP_PROCESS_USER=$(echo $TOP_PROCESS_INFO | awk '{print $4}')
TOP_PROCESS_MEM=$(echo $TOP_PROCESS_INFO | awk '{print $3}')
logger "Killing process $TOP_PROCESS_PID, owned by $TOP_PROCESS_USER, which is using $TOP_PROCESS_MEM% of memory."
kill -9 $TOP_PROCESS_PID
fi
# 每隔10秒检查一次
sleep 10
done
确保脚本具有可执行权限:
bashchmod +x monitor_memory.sh
在/etc/systemd/system/
目录下创建一个服务文件,例如memory_monitor.service
,其内容如下:
ini[Unit]
Description=Memory Monitor Service
After=network.target
[Service]
Type=simple
ExecStart=/root/monitor_memory.sh
StandardOutput=append:/var/log/memory_monitor.log
StandardError=append:/var/log/memory_monitor.log
Restart=on-failure
[Install]
WantedBy=multi-user.target
请将/root/monitor_memory.sh
替换为实际的脚本路径。
重新加载systemd
,启动并启用服务:
bashsudo systemctl daemon-reload
sudo systemctl start memory_monitor.service
sudo systemctl enable memory_monitor.service
使用以下命令检查服务状态:
bashsudo systemctl status memory_monitor.service
如果一切正常,服务应该会显示为“active (running)”。
journalctl
查看日志bashsudo journalctl -u memory_monitor.service
本文作者:Dong
本文链接:
版权声明:本博客所有文章除特别声明外,均采用 CC BY-NC。本作品采用《知识共享署名-非商业性使用 4.0 国际许可协议》进行许可。您可以在非商业用途下自由转载和修改,但必须注明出处并提供原作者链接。 许可协议。转载请注明出处!