生活碎碎念-1

生活碎碎念-1

昨天刚赶完ICASSP的ddl,终于有时间对文件数据等进行整理备份。今年由于疫情的影响,有大量工作都是封在寝室期间在笔记本上完成的,后来寝室解封,又有一些工作在实验室主机上进行,导致同一个项目的一部分文件数据在笔记本上,一部分在实验室主机上,一部分在两台机器上都有副本,使用起来极不方便。再加上之前硬盘坏掉后,虽然自己开始重视数据备份,但是备份逻辑很不清晰,三个备份盘上的备份数据盘根错节,几乎失去了可用性。种种因素叠加,这次的数据整理备份注定是个艰巨而耗神的任务。

果不其然,预计一天搞定,实际用了两天,这还是最后阶段的数据整理十分粗糙的情况。整个过程很是烦人,不过也是咎由自取,面对之前“屎山”一般的数据管理和数据备份,这次着实有不少经验教训需要记录下来以自省。

  1. 小的问题即刻解决,不要妄图积累起来集中解决!

    如果每天下班前把今天新建的文件进行数据管理和备份,可能也就是几分钟的事情;即使每周按时整理备份一次也不会有太多的工作量。但是一旦积少成多,等文件数据累积成“屎山”一般的结构和数量后再进行整理备份就不是一件轻松愉快的事情了,整理文件数据所付出的时间精力随着未整理文件数据量的增多绝不是线性增长的,而是近似于几何式的爆炸式增长;而且随着时间久远,一些文件数据已经记不起来用途,很容易出现“误删”或者“多处无效拷贝”的情况,损害数据整理备份的效果。

    因此,要将文件数据整理备份当成一种自然而然的日常习惯,就像每天工作前先查看电子邮件一样 (这是另一个需要保持的习惯,emmm)。不要抱着集中处理的想法任由数据肆意堆积。

    BTW,安利一个开源软件 – FreeFileSync,不错哦。

  2. “标准化”很重要!

    代码标准化的意义不必多说,各大公司都有严格的代码书写标准便很能说明问题,这次数据整理让我意识到,“标准化”的意义不止局限于代码书写规范。以文件数据整理为例,文件管理是通过树状文件系统承载的,文件树的构建、文件/文件夹的命名对于文件管理有着重要的意义。然而,以往的文件树构建以及文件/文件夹的命名往往很随意,导致文件系统的组织度很低、文件系统结构很不清晰,不但导致查找文件时很依赖熟练度,而且容易导致相同性质的文件被保存在多个不同的目录下,又或是出现多份拷贝,给文件整理备份造成极大的麻烦。此外,即使是同一个人在不同时期的文件命名风格,路径管理风格也是很不相同的,若是再有一点点强迫症,两者叠加就会时不时对文件树“大动干戈”,这是很低效的行为。不知道网络上有没有类似于《Google 开源项目风格指南 (python)》这样的用于文件管理文件命名的成熟标准呢?

  3. 规划在先,行动在后!

    就文件数据管理而言,在没有建立起清晰的规划之前做的一切无非是在堆砌更大的问题,无效且有害。

    比如,不考虑网络文件、网盘的情况下,从硬件上划分,我有两个主要的文件数据源:笔记本和实验室主机,三个主要的文件备份设备:实验室主机的在线磁盘备份盘、一个磁盘备份盘和一个移动硬盘备份盘;从文件性质上划分,需要重点管理和备份的数据包括个人数据、生活数据 (照片视频等) 以及科研数据 (项目、论文等)。如何根据文件性质、文件内容建立合理清晰全面的文件树,如何在多个数据源之间做好文件同步,如何在数据源和备份设备之间建立合理的映射关系,如何确定规律性整理间隔等等都是在规划阶段就需要确定并解决的问题,只有在规划阶段做好了这些,以后的行动才能“事半功倍”!

    我相信这一经验的意义不局限于文件数据管理。

  4. 重要的文件“狡兔三窟”

    相对于数据恢复的费用来说,数据备份的单位价格很是廉价,一个4T的磁盘也就两三百的样子,因此,在购买备份盘时不要吝啬,最好是买两份做“冗余备份”!同时,无论哪种硬盘都有坏掉的可能性,尤其是使用时间已久的硬盘。因此,我的想法是:特别重要的文件数据跟一般的文件数据分盘备份,并同时维护至少两份一模一样的备份,这样就需要四个硬盘,其中一份硬盘可以一直放在主机上保持在线状态方便每日/周备份 (使用FreeFileSync十分便捷就能搞定);重要备份数据盘每隔四年进行更换,一般备份数据盘每隔八年更换一次。八年可能听起来很长,不过考虑到备份盘并不会频繁读写,其使用寿命还是有保障的!同时,也要时不时检查下硬盘的状态,比如,坏道越来越多可能就暗示着磁盘不是很可靠了。

过去几年,自己遇到过误删除重要数据而没有相应备份的情况,也遇到过硬盘坏掉而不得不求助专业数据恢复服务的情况,现在则是刚刚遇到整理备份“屎山”一般文件数据的情况,“吃一堑长一智”,希望以后自己能做好数据的整理和备份。


生活碎碎念-1
https://zray111.github.io/2022/09/28/生活碎碎念-1/
作者
ZRay
发布于
2022年9月28日
许可协议