NAS折腾记(5)：群晖硬盘休眠设置与分析

NAS需要硬盘休眠么？群晖怎么才能硬盘休眠？这一期我们来聊聊硬盘休眠，同时分享一下我是怎么分析硬盘休眠的日志的，以及设置群晖系统休眠的。

这期我们从几个问题来入手。

硬盘休眠有什么好处？

众所周知，机械硬盘工作的时候，由电机带动盘片高速转动，磁头依靠盘片的高速旋转引起的空气动力效应悬浮在盘片上。

在不休眠的情况下，即使没有数据读写，为了保持较快的响应和磁头的悬浮，磁盘也会一直处于转动的状态，而且如果磁盘不支持降速的模式，磁盘都是以固定的转速在转动的。这时候的功率大概在8-10w.

而在停机或者休眠的时候，磁头回到停泊区，电机停止转动，消耗就很小了，功率大概在1w左右。

那么，可以看出，机械硬盘休眠，最大的好处应该就是省电。如果你的NAS上有5块硬盘，也就是说平均可以降低35w, 一天大概能省一度电。

当然，会有小伙伴说，这时候电机停止运转，磁头归位了，减少的电机/磁头的损耗，增加了硬盘的寿命，其实这个增加的还真不大，至少对我们来说，完全不用去操心的。反而是磁头的起停，它可能增加磁头损害的几率，这就有了如果频繁的休眠启动不如不休眠的说法。

其实影响磁盘寿命的更多的是温度，震动，磁场啥的。再说磁盘买来就是消耗的，其寿命我们就不用太过操心，买的时候买那种3年，5年质保的，平常数据多备份就好。

你需要硬盘休眠么？

我在平台搜索了一下，关于NAS硬盘休眠的文章不多，群晖休眠视频更是没看到。那么说明一个问题，硬盘休眠可能不那么重要。

这是为什么呢？因为很多情况下，我们的机械硬盘是得不到休眠的。在折腾NAS的时候，我们会在NAS上跑一些影音刮削软件，Docker或者PT保种之类的。而这些软件总有一些定时任务，网络连接，日志写入等等，总之在不停的对硬盘进行读写，硬盘基本上是没有休息时间的。

那么，如果你也是这种折腾的用户,恭喜你，这篇文章看到这里就可以了。

当然，如果你不折腾，装NAS就是来存储数据，平常也就使用一些群晖自家的图片管理软件，VideoStation，也不用保种，下完即删的这种，需求比较简单，完全就可以考虑设置一下硬盘休眠。

群晖硬盘休眠设置

我先直接告诉大家怎么设置再讲分析，如果你按照我的设置方法不能生效，可以再看后面一节怎么分析。

第一步、关闭 DHCP

DHCP 即动态主机设置协议，简单理解就是为插入路由器的设备动态分配IP的。这个分配的IP是有一个租赁时间的，时间到了后客户端需要重新续租，这时候机器就被唤醒了。

其实，我们家里固定的一些设备, 可以设置一个固定IP就好了，完全不用DHCP。

于是，这里我们将DHCP关掉，给他一个固定的IP。

打开 “控制面板 > 网络 > 网络界面”, 选择"网络界面"，选择下面的局域网连接，点击"编辑"。

点击 “IPv4”, 选择这个 “手动设置网络配置”。这里的IP你可以直接使用当前DHCP分配的这个IP，也可以自己设置一个，只要和局域网内其他设备不冲突就好。

如果你和我一样，有多个，就都修改一下。

然后确认保存。

第二步、日志写入内存

影响群晖休眠的还有第二个因素，就是日志。特别是黑群晖，如果有一些硬件的不兼容，系统会间歇或持续的输出错误日志，而这些日志是写入到磁盘的，这也就导致了磁盘无法休眠。

我这里可以将日志文件全部输出到内存中，将日志目录直接挂载到临时目录(临时目录默认挂载在内存中的)。

但这样还有一个问题，如果我们关机了，内存中的日志不就消失了么？所以这里我们又加了两个触发任务，当开机的时候，将日志挂载到零时目录。当关机的时候，将日志拷贝到硬盘备份文件夹中。

打开 “控制面板 > 计划任务”, 点击"新增 > 触发的任务 > 用户自定义脚本"。

“常规"这里，任务名称写一下，注意这个账户需要用root, 不然没有权限操作后面的脚本。

“任务设置"这里，将下面的运行命令贴进去。

if [ ! -d "/var/logbak" ]; then
     mkdir /var/logbak
     cp -a -f /var/log/.  /var/logbak/
fi
cp -a -f /var/logbak/.  /tmp/log/
mount -B /tmp/log  /var/log

通知设置中，如果你配置了SMTP，可以和我一样勾选一下，填写邮箱，这样每次启动成功执行命令会给你发送一封邮件。

确认保存。

同样，再次点击"新增 > 触发的任务 > 用户自定义脚本”，这次"事件"我们选择关机，账户还是要用root。

“任务设置” 这里一样，把下面的脚本粘贴进去。

cp -a -f /tmp/log/.  /var/logbak

确认保存。

第三步、开启硬盘休眠

在"硬件和电源 > 硬盘休眠” 中，启用这个休眠。

这里的时间可以设置到20分钟，甚至半小时，防止我们自己操作，频繁的去唤醒。

然后应用保存。

如果要更好的观察休眠，可以把 “启用硬盘休眠日志” 勾选上。

到这里我们的休眠设置就做完了。可以关闭页面，断开链接，等待一段时间，看看你的群晖是不是可以正常休眠了。

可以通过日志中心，搜索woke up来识别是否正常休眠。woke up是硬盘每次被唤醒就会输出这样一条日志。如果频繁的woke up就还有问题。如果压根没woke up说明就没休眠。如果像我图片中这样，一天几次，基本都是我们使用的时候去唤醒的，那说明睡觉基本正常了。

当然，有朋友发现，即使做完了上面的三步，还是无法休眠。怎么办呢？这时候就要我们自己去分析一下是什么服务在读写硬盘了。

下面的一节我们就来看看硬盘不休眠的分析过程。

日志分析

开启休眠日志

在"硬件和电源 > 硬盘休眠" 中，启用硬盘休眠日志。

然后应用保存。

在"技术支持中心 > 技术支持服务"，系统日志工具这里，启用系统休眠调试模式。

“遇到问题” 这里选择 “无法休眠”，应用即可。

然后把网页，SMB服务等客户端全部关了，等待一天。

分析日志

首先要在 “控制面板 > 终端机和SNMP” 中把SSH开启，并应用。

然后我们将硬盘休眠的日志拷贝下来。日志文件在 /var/log 目录下。如果你熟悉 scp 命令，可以直接通过命令拷贝。

我这里就使用WinSCP软件来做展示。

打开WinSCP软件，文件协议选择"SCP", 主机名填写群晖的IP地址，用户名密码就是群晖的登陆密码。填好后点击登陆。

我们点击这个文件夹图标，选择打开目录。

输入 /var/log 直接跳转到该目录下面。

往下拖，找到这几个文件，拖到左边的文件夹中。

然后在左边的文件夹中找到这几个文件。用文本编辑器打开hibernationFull.log文件。

打开文件一看8000多行，怎么看呢？我们利用排除法。

我们先将下面这样的行排除。sync程序是内核将脏数据落盘，而这个脏数据一般是用户态操做的结果，不是主动触发的。

[226186.055466] ppid:6630(syno_hibernatio), pid:10639(sync), WRITE block 2213056 on dm-8 (32 sectors)

同样还有kthreadd这种内核调度的，如：

[226193.396532] ppid:2(kthreadd), pid:5644(jbd2/md0-8), WRITE block 4527896 on md0 (8 sectors)

然后就是排除非写入硬盘的。如下面这种带有 on tmpfs,on proc 和 on cgroup 的。

[226188.546357] ppid:1(systemd), pid:10668(synostgd-disk), dirtied inode 7354598 (temperature.tmp) on tmpfs
[226188.627252] ppid:1(systemd), pid:7698(irqbalance), dirtied inode 4026532190 (smp_affinity) on proc

接着我们就可以来分析剩下的内容了。如我这里的文件（为了展示类似的行我就删除了）：

[226185.558637] ppid:1(systemd), pid:7729(synologrotated), dirtied subvolume 256 inode 31906 (.SMBXFERDB-shm) on dm-8
[226186.449574] ppid:1(systemd), pid:4292(EmbyServer), WRITE block 74240 on dm-8 (32 sectors)
[226188.534733] ata3: wake up successful, the reset fail can be ignored
[226188.543616] ata4: wake up from deepsleep, reset link now
[226191.559613] ata4: wake up successful, the reset fail can be ignored
[226193.396547] ppid:7729(synologrotated), pid:10646(logrotate), dirtied inode 401663 (logrotate.status.tmp) on md0
[226193.396551] ppid:1(systemd), pid:27845(syslog-ng), WRITE block 13236504 on md0 (8 sectors)
[226193.396555] ppid:1(systemd), pid:27845(syslog-ng), WRITE block 4647728 on md0 (8 sectors)
[226193.397410] ppid:7729(synologrotated), pid:10646(logrotate), WRITE block 13236552 on md0 (32 sectors)
[226193.598388] ppid:7729(synologrotated), pid:10646(logrotate), dirtied inode 404439 (?) on md0
[226193.598673] ppid:1(systemd), pid:27845(syslog-ng), dirtied inode 393912 (system) on md0
[226199.476489] ppid:11831(interfaceUpAdju), pid:12201(synonetdtool), dirtied inode 394012 (?) on md0
[226199.476496] ppid:1(systemd), pid:4292(EmbyServer), dirtied inode 31889 (embyserver.txt) on dm-8
[226199.476521] ppid:1(systemd), pid:4292(EmbyServer), WRITE block 8462896 on dm-8 (8 sectors)
uptime : [226225.649521]

就已这个来我们来分析一下。

logrotate / synologrotated ：系统记录日志或日志轮换的进行，一般正常休眠应该不会工作，不用管。
syslog-ng: Nginx WEB页面/反向代理服务，这个可能是我中间访问了，不用管。
interfaceUpAdju: 接口变动，这个应该是我动路由器的时候，动到了网线，把网重新插拔了，一般不会有，不用管。
EmbyServer : 影音服务，感觉元凶找到了，应该是EmbyServer本身有一些定时任务，我们可以考虑去设置一下或者直接卸载==

我这里直接把EmbyServer卸载了==，当然你也可以看看服务有没有定时任务的设置开关，去手动设置一下，如我这里的EmbyServer, 可以把这些时间延长。

经过将日志全部转移到内存，卸载了EmbyServer后，我的硬盘就可以正常休眠了。基本上不访问就不醒了。

如果你的经过一轮还不行，那就多观察几轮，找到最终唤醒磁盘的服务。

如果说，你喜欢折腾一些服务，或者挂个PT，开个博客，那把硬盘休眠直接关了吧。

好啦，这篇文章就到这里啦。感谢阅读。如果日志分析中，不知道那个进程是干什么的，可以在留言板上回复，我们一起来看看。

硬盘休眠有什么好处？#

你需要硬盘休眠么？#

群晖硬盘休眠设置#

第一步、关闭 DHCP#

第二步、日志写入内存#

第三步、开启硬盘休眠#

日志分析#

开启休眠日志#

分析日志#

视频版本#