我们的房子,财富,社会地位,我们的眼睛,身体,我们的亲人,子女,朋友,我们所珍惜的一切,都是不是我们的,包括我们自己。它们只是命运女神借我们暂用一下。 我们要像虔诚的,圣神的保管者一样好好保管他们。如果有一天命运女神想要收回它们,我们绝不该抗命不从,而应该满心欢喜, 不带怨气地说:“感谢您让我拥有并保管了这一切,我已悉心保管,现在如数奉还。”-- 斯多葛哲学家,塞涅卡

目前,对于 Filecoin 矿工来说,除了抵押币,硬件算是最大的一笔现金投入了。Filecoin 矿机的对于硬件的配置很高。现在一台算力机少则10几万,多则20几万。 硬件没选对的话,会严重影响封装的效率,对于矿工来说是损失也是很大的。本文分享一些自己在 Filecoin 硬件选购上的一些心得。对于那些购买云算力的同学,请直接略过。

1. 租还是购?这是一个问题。

在打算买硬件之前,我觉得你应该先认真考虑一下你到底需不需要买硬件,或者说你到底需要买哪些硬件。如果不知道自己该买还是租的话,我这里提供给你几个决策的信息。

  1. 一般来说,Miner 机器,daemon 机器(节点机)以及存储机器你是必须采购的。因为这个是你整个 Filecoin 集群的命门所在,这些机器掌握在手里,将来不管你是换机房也好,换技术服务商也好,都不会太麻烦,你只需要把这些机器搬走了,你的质押币,存储数据,算力什么的就都跟着过去了。
  2. 我估计很多机器供应商都会这么跟你说:算力机器你是可以租的,因为你算力封装完,这些机器就没有用了。这话对于 99% 以上的矿工来说,毫无疑问是正确的。因为大部分矿工目前还是封装 Junk Data 也就是所谓的垃圾数据,垃圾数据一般是没人来检索的,所以你封装好的扇区,除了做时空证明,几乎不会再去访问它。但是如果你接了订单,那么数据检索的时候可能要做 unseal,这个计算量不亚于 PC1,这个时候你不可能全让 Miner 来做的。所以如果有这种需求,那么建议你自己还是采购几台算力机,以备不时之需。
  3. 目前提供算力出租的还是有不少的,价格一般在 500 RMB / TiB 左右,1 PB 算力大概需要 50万 左右,看着成本挺高,但是应该只有买机器成本的 1/6 到 1/10 左右。 具体视情况而定,比如如果你需要在 10 天之内封装 1PB 的话,那么你就要花 500 万买算力机,如果是要 1 月的话,那么可能就只要 200万不到。
  4. 买了机器用完了还可以租给别人。可能选择买机器的人都有这个想法 O(∩_∩)O哈哈~

2. CPU 选择

CPU 的选购也需要根据你让机器承担的角色来确定选择什么样的 CPU 架构。

  1. 节点机器和 Miner 机器一般优先选择 Intel 的,因为价格摆在那呢。有网友说 Miner 用 AMD 的 CPU 会稳定一些,但是我在实测的过程并没有发现,也许是我没有遇到。不过由于 AMD 的核多,主频也高,所以选择 AMD 的CPU 你只需要购买一颗 CPU 就行了,而选 Intel 的话,最好使用双路 CPU。Intel 的推荐 2667 V4,AMD 的话 7302/7402 都是不错选择。

  2. PC1 任务的算力机只能用 AMD 的 CPU,主频高的单个任务完成的时间短,核心组数多的可以并行的路数多。注意我这里用的是核心组数而不是核心数,这是因为 PC1 的 SDR 加速每次用到的是一组共享 L3 缓存的核,而不是一颗核。这一组核中一些用于计算加速,一些用于数据传输加速,共同完成 PC1 的加速(关于 PC1 加速核的设置,我以后会专门写一篇文章介绍)。目前矿工用的比较多的几款 AMD 芯片是 7542/7742/7302 等。一般来说 PC1,PC2,C1 任务都是在同一台机器上完成的。
  3. C2 算力机(又称证明机器)一般首选 Intel 的 CPU,2680/2690 V4系列,2667 V4 等,都是不错的选择。由于 C2 前期依赖 CPU 的计算,所以如果要并行多路 C2 任务,记得 CPU 要用 2 颗。
  4. 家用 CPU 一般选择 36/37/38/3900x,3950x/60x/70x 都是不错的选择。其中 3960X 和 3970x 支持 256G 内存可以并行 3PC1 + 1PC2。性价比高一些。

3. RAM 和主板

内存的话,基本没有什么好选择,基本用 ECC 的服务器内存,频率 2666MHz 以上就好了,家用机一般用海盗船的内存。还有就是内存最好买新的,二手内存有不少假内存。

AMD CPU 一般主板一般都选用泰安或者超微的。建议直接用厂家的准系统(机箱,电源,主板一体机),性能稳定可靠一些。 Intel 的 CPU 一般选华硕或者技嘉的主板就好了。

4. GPU 选择

GPU 一般分三个梯队:

  1. 一线品牌:华硕,微星,技嘉的超级雕系列也算一线吧。
  2. 二线品牌:技嘉
  3. 三线品牌:蓝宝石,七彩虹,影驰等
  4. 四线品牌:丽台,索泰,戴尔等

根据你资金实力对号入座就好了。好显卡主要体现在做工精良,散热良好,性能稳定,跑个十天半个月之后还是一样稳如老狗,差点一般就能坚持两三天之后性能就急剧下降了。咱们就拿跑 Lotus PC2 任务来说,一线品牌的显卡能够跑出1个月的稳定数据,单个任务的时间稳定在 26min-32min。而三线的显卡一般前2天能保持 30min 左右,后面就越来越慢,一个星期以后基本都到 50min-60min 了。这还算好的,能正常跑完的,有的干脆给你卡上几个小时,甚至十几个小时。

一般来说硬件搭配良好的机器,调试个2-3天就可以正常跑任务了,差点的就不好说了,我们有个客户硬件不知道是没有经过出产测试还是啥的,结果第一轮跑下来(3天),15 台机器就剩下两台可用,一个星期之后这两台也阵亡了。结果我们协助厂商那边前前后后调试了2个月,才把硬件调稳定了。除了 CPU,电源,机箱之外,其他所有的配件都换了。

所以说,有句话说的好,出来混的,迟早都要还的,不该省钱的地方你省了,后面都要成倍的补回来。

还要一点需要提醒的是,最好不要买游戏显卡,这种显卡在刚开始跑的时候确实速度很快,但是连续跑几天就不行了,性能下降的很厉害。

5. SSD/NVME 选择

SSD/NVME 我们主要关注它的速度和使用寿命(擦写次数)。这就不得先说下 SSD 的颗粒分类了。这里先简单说下: 固态硬盘的颗粒目前主要有4种:SLC,MLC,TLC 和 QLC。一般来说,SLC(单层存储单元)理论擦写次数10万次,MLC(双层存储单元)3000-10000次,TLC(三层存储单元)500-1000次,qlc(四层存储单元)仅仅150次。读写速度也是 SLC > MLC > TLC > QLC,当然,生产成本也是 SLC > MLC > TLC > QLC。从价格上来说,SLC 基本是 MLC 的三倍,MLC 是 TLC 的 1.5-2 倍左右。

好了,大概知道几种硬盘的尿性了,那么我们 SSD/NVME 的选择也就比较明了了。

  1. 系统盘统一用 SSD,颗粒的话用 TLC 就好了。Miner 的系统盘最好用 MLC 的,因为 Miner 轻易不能关机,所以系统故障率要越低越好。节点的用来同步区块数据的 SSD 建议选用 MLC 的。
  2. PC1,PC2 算力机的缓冲盘,建议用 M.2 或者 U.2 接口的 NVME 磁盘,同时为了保证长时间持续读写不掉速,你最好也选 MLC,最次也要 TLC 的,QLC 建议就不要用了。
  3. C2 证明机器的缓冲盘(一般证明机要同时做 AP 任务),一般一块 2TB 的 NVME 就够了,颗粒选 TLC 就行。
  4. 存储如果你用 Ceph 或者 ZFS 存储系统的话,那么存储系统的缓存盘(日志盘)最好也选用 MLC 的,如果想降低成本也可以选 TLC 的,QLC 也不建议要。

所以说,以后别再问:为什么别人买的 2TB 的 NVME 只要 1200,而我买的却要 2100 呢? 因为虽然 MLC 和 QLC 只相差一个字,但是价格却相差好几倍,就如同宝马 X1 跟 X5 的差距一样。

关于 SSD 硬盘颗粒更详细的介绍,请移步我的另一篇博客 谈一谈不同固态硬盘颗粒(SLC,MLC,TLC,QLC)的区别

6. 其他配件

电源:一般用长城的电源就 OK 了,节点机器 1200W 左右就可以了,算力机一般都推荐 1600W。

暴力风扇:千万别小看这小东西,建议除了节点机器和存储机,其他机器都装上。所有机器散热都是大问题,一个暴力风扇也许能解决你 GPU 和磁盘散热的大问题,直接提高你机器的封装效率。

转接卡/RAID 卡:这个也非常重要,因为一般我们的算力机器都是要插好几张 NVME 磁盘组 raid0 的,但是一般主板上都没有这么多 NVME 磁盘插槽,要通过转接卡或者 raid 卡来接入。好的 raid 和转接卡能让你的磁盘长期运行不掉速。

总结

Filecoin 挖矿对硬件的要求非常高,不仅要稳定,而且要高性能的持续运行,这对于整机的硬件搭配要求是非常高的。

下面贴上目前主流矿机的配置清单:

Miner 机器

配件类别 型号参数 配件数量
主板 超微 H11DSI 1
CPU AMD7402 2
散热器 AMD SP3-2U 纯铜 1
内存 三星 DDR4 RECC 64G 2933mhz 4
显卡 微星 RTX 2080Ti 涡轮 2
系统盘 Intel 240G SATA SSD 1
万兆网卡 单光口万兆网卡+模块 1
机箱 2U机箱 + 暴力风扇 1
电源 长城 1200W 双电源 1

Daemon 机器(节点机)

配件类别 型号参数 配件数量
主板 超微 H11DSI 1
CPU AMD7402 1
散热器 AMD SP3-2U 纯铜 1
内存 三星 DDR4 RECC 64G 2933mhz 4
系统盘 Intel 240G SATA SSD 1
缓存盘 三星 U.2 2T SSD RAID0 4
转接卡 PCIe转U.2转接卡4盘位 1
网卡 10G 光口万兆网卡+模块 2
机箱 4U机箱 + 暴力风扇 1
电源 长城 1200W 双电源 1

PC1,PC2 Worker

配件类别 型号参数 配件数量
CPU AMD 7542 1
准系统 H11SSW-NT(4U 机箱、1600W 冗余电源 + 暴力风扇) 1
内存 三星 DDR4 RECC 64G 2933mhz 4
显卡 微星 RTX 2080Ti 涡轮 2
系统盘 Intel 240G SATA SSD 1
缓存盘 4T U.2 SSD 企业级(MLC) 4
万兆网卡 单光口万兆网卡+模块 1
Raid 卡 U.2 磁盘 Raid 1
网卡 双口光口万兆网卡+模块 1

Commit2 Worker

配件类别 型号参数 配件数量
主板 超微 X10DRG-Q 1 1
CPU Intel E5 2667 V4 2
散热器 AMD SP3-2U 纯铜 1
内存 三星 DDR4 RECC 64G 2933mhz 12
系统盘 Intel 240G SATA SSD 1
缓存盘 三星 U.2 2T SSD 1
显卡 微星 RTX 2080Ti 涡轮 4
网卡 10G 光口万兆网卡+模块 1
机箱 4U机箱 + 暴力风扇 1
电源 长城 1600W 双电源 1

最后,回答 Filecoin 矿工常在群里问的问题:为什么别人机器配置跟我的一模一样,跑的结果却比我好这么多?

我想说的是,抛开那个“别人”自己优化代码的因素,也许你的机器的配置只是“长”得跟人家的一样而已,“内部”配置可能真的不是一样的。

硬核广告,高能预警!!!

如果你不知道该如何下手去采购机器,或者说找不到靠谱的硬件供应商,可以联系我们。我们帮您去对接供应商,把关硬件配置,我们提供靠谱的硬件方案,然后帮您去跟供应商死磕,大到配件是否齐全,小到跳线是否插的是否正确。帮您验收机器并对配件和整机性能进行极限压力测试,确保机器配置合理,性能可靠再送到您的机房。当然,我们是要收取介绍费和测试费用的,非诚勿扰。