4.2 KiB
4.2 KiB
tags, date created, date modified
| tags | date created | date modified |
|---|---|---|
| 星期三, 十一月 19日 2025, 4:10:16 下午 | 星期三, 十一月 19日 2025, 4:10:27 下午 |
1.1.6 时间同步与系统关键疑点深挖 (Time Synchronization & Deep-Dive)
1. 时间同步服务健康度 (Time Synchronization Health)
-
关键性:P1
-
信息解析:
- 时钟源 (Clocksource):系统正确使用了
arch_sys_counter,这是 ARM64 架构下的高精度硬件计数器,基准可靠。 - 同步偏差 (Offset):当前与 NTP 服务器的偏差约为 6ms - 7ms (
-6106us~+7072us)。对于毫秒级雷达应用尚可接受,但若涉及多站协同或相控阵微秒级同步,此偏差过大,建议改用 PTP (Precision Time Protocol) 或连接本地高精度 GPS 时钟源。 - 频率漂移 (Frequency Skew):
89.988 ppm,表明本地晶振走得稍快,但在 Chrony 修正范围内。
- 时钟源 (Clocksource):系统正确使用了
-
探测命令与结果:
cat /sys/devices/system/clocksource/clocksource0/current_clocksource arch_sys_counter chronyc sources -v ^* 113.141.164.38 … -6106us[-6155us] +/- 35ms ^+ 223.4.249.80 … +7072us[+7072us] +/- 34ms
2. GPU 链路降级确认 (GPU Link Downgrade Verification)
-
关键性:P0 (Critical)
-
信息解析:
- 链路状态:明确确证 GPU 运行在 PCIe 4.0 x8 模式 (
Speed 16GT/s (ok), Width x8 (downgraded))。 - 根本原因:物理插槽可能仅为
x8电气连接,或者 GPU 金手指接触不良,亦或是主板 BIOS 设置了通道拆分(Bifurcation)。 - 后果:理论带宽上限从 32GB/s (x16) 降至 16GB/s (x8)。若雷达回波数据量巨大(如多通道宽带信号),这将成为数据传输的硬瓶颈。
- 链路状态:明确确证 GPU 运行在 PCIe 4.0 x8 模式 (
-
探测命令与结果:
lspci -s 0001:01:00.0 -vv | grep -E "LnkCap:|LnkSta:" LnkCap: Port #0, Speed 16GT/s, Width x16 … LnkSta: Speed 16GT/s (ok), Width x8 (downgraded)
3. 系统性能配置档 (System Performance Profile)
-
关键性:P1
-
信息解析:
- 激活策略:
throughput-performance已激活。 - 缺陷:尽管使用了高性能配置,但前序审计发现
numa_balancing=1依然开启。这说明 Kylin 默认的throughput-performance策略并未激进地关闭 NUMA 自动均衡,后续需创建自定义 Tuned Profile 来覆盖此项。
- 激活策略:
-
探测命令与结果:
tuned-adm active Current active profile: throughput-performance
4. 透明大页整理策略 (THP Defrag Policy)
-
关键性:P2
-
信息解析:
- 当前状态:
[madvise]。 - 评价:这是一个相对安全的设置。意味着内核仅在应用程序通过
madvise(MADV_HUGEPAGE)显式请求时才整理大页,避免了全局强制整理带来的随机延迟。与 1.1.2 节建议一致。
- 当前状态:
-
探测命令与结果:
cat /sys/kernel/mm/transparent_hugepage/defrag always defer defer+madvise [madvise] never
5. 网络接口映射概览 (Network Interface Mapping)
-
关键性:P2
-
信息解析:
- 接口列表:
ens4f0-ens4f3:这极有可能是那是那块带宽受限的网迅四口千兆/万兆网卡。目前ens4f1为UP状态。ens2f7u1u2:USB 网卡或转接设备,当前处于UP状态。
- 下一步行动:后续网络调优时,需重点针对
ens4f*系列接口使用ethtool检查 Ring Buffer 大小和硬中断聚合(Coalesce)设置。
- 接口列表:
-
探测命令与结果:
ip -br link show ens4f0 DOWN … ens4f1 UP …
1. 开发环境与构建生态 - 审计总结
至此,1.1 操作系统与内核基座 的深度审计已全部完成。我们已经掌握了这台机器的“体检报告”:
- 底座:Kylin V10 SP1 (aarch64), Kernel 4.19 (GCC 7.3 构建), 64KB PageSize。
- 算力:Feiteng S5000C + Iluvatar 智铠 GPU (PCIe x8 降级运行)。
- 风险:PageSize 兼容性、GPU 带宽减半、NVMe 中断挤压在 CPU0、系统时钟偏差较大。