创建仓库

2025-12-11 07:24:36 +08:00
commit 0d81c1792d
128 changed files with 15104 additions and 0 deletions
--- a/系统基座文件/1/1.3/1.3.1
+++ b/系统基座文件/1/1.3/1.3.1
@@ -0,0 +1,66 @@
+---
+tags: 
+date created: 星期三, 十一月 19日 2025, 5:27:53 下午
+date modified: 星期三, 十一月 19日 2025, 5:28:03 下午
+---
+
+# 1.3.1 驱动核心模块状态 (Driver Kernel Modules)
+
+**1. 驱动加载与版本一致性 (Driver Load & Consistency)**
+
+  - **关键性**：**P0**
+  - **信息解析**：
+      - **核心状态**：驱动 `iluvatar` (v4.3.8) 已成功加载。
+      - **健康自检**：dmesg 明确输出 `iluvatar 0001:01:00.0: DEV-0 is okay.`，标志着硬件初始化通过，未遇到固件加载错误。
+      - **签名警告**：`module verification failed` 提示内核被“污染（tainted）”，这是因为使用了厂商提供的 Out-of-tree 非开源驱动。在开发环境中可忽略，生产环境若有强安全合规要求需进行自签名。
+  - **探测命令与结果**：
+
+    ```bash
+    dmesg | grep "iluvatar" | tail -n 5
+    [ 6.657344] iluvatar 0001:01:00.0: enabling device (0000 -> 0002)
+    [ 7.037538] iluvatar 0001:01:00.0: DEV-0 is okay.
+    ```
+
+**2. 关键模块参数配置 (Key Module Parameters)**
+
+  - **关键性**：**P1**
+  - **信息解析**：
+      - **统一寻址 (UVA/VMM)**：`itr_enable_vmm_va:Y`。开启了虚拟内存管理，允许 GPU 直接访问进程虚拟地址空间，简化了 `cudaMallocManaged` 等 API 的实现。
+      - **保留显存**：`itr_text_mem_size:512`。驱动预留了 512MB 显存用于存放指令代码（Text Segment）。对于显存较小的卡（如 8GB），这 0.5GB 的开销需计入总预算。
+      - **功耗策略**：`power:0`。通常 0 代表高性能模式（关闭激进节能），这有利于雷达信号处理的实时性稳定性。
+  - **探测命令与结果**：
+
+    ```bash
+    grep -r . /sys/module/iluvatar/parameters/
+    /sys/module/iluvatar/parameters/itr_enable_vmm_va:Y
+    /sys/module/iluvatar/parameters/itr_text_mem_size:512
+    /sys/module/iluvatar/parameters/power:0
+    ```
+
+**3. 设备节点与权限映射 (Device Nodes & Permissions)**
+
+  - **关键性**：**P0**
+  - **信息解析**：
+      - **用户态接口**：`/dev/iluvatar0` 已创建。
+      - **权限状态**：`crw-rw-rw- (666)`。这意味着**任何用户**都可以提交 GPU 任务，无需加入特定组（如 `video` 组）。虽然方便开发，但在多用户服务器上存在安全隐患。
+      - **PCI 绑定**：`/sys/bus/pci/…/driver` 链接正确指向了 `iluvatar` 驱动，确认设备未被 `pci-stub` 或 `vfio-pci` 错误抢占。
+  - **探测命令与结果**：
+
+    ```bash
+    ls -l /dev/iluvatar0
+    crw-rw-rw- 1 root root 239, 0 …
+    ```
+
+**4. 虚拟化与直通依赖 (Virtualization Dependencies)**
+
+  - **关键性**：**P2**
+  - **信息解析**：
+      - **VFIO 栈**：`mdev` 和 `vfio` 模块被 `iluvatar` 依赖。
+      - **架构意义**：这表明智铠驱动采用了现代化的 **MDEV (Mediated Device)** 架构设计。即使在物理机上，它也可能利用 VFIO 框架来管理 DMA 和中断，这为将来在 Docker 容器或 KVM 虚拟机中直通 GPU 提供了原生支持。
+  - **探测命令与结果**：
+
+    ```bash
+    lsmod | grep iluvatar
+    iluvatar  983040  0
+    vfio      262144  3 vfio_mdev,vfio_iommu_type1,iluvatar
+    ```
--- a/系统基座文件/1/1.3/1.3.2
+++ b/系统基座文件/1/1.3/1.3.2
@@ -0,0 +1,61 @@
+---
+tags: []
+date created: 星期三, 十一月 19日 2025, 5:29:54 下午
+date modified: 星期三, 十一月 19日 2025, 5:30:07 下午
+---
+
+# 1.3.2 运行时环境与兼容层 (Runtime Environment & Shim Layer)
+
+**1. 环境变量配置 (Environment Configuration)**
+
+  - **关键性**：**P1**
+  - **信息解析**：
+      - [cite\_start]**SDK 根路径**：`COREX_HOME` 被正确设置为 `/usr/local/corex` [cite: 1]。这是许多第三方构建脚本查找头文件和库的依据。
+      - [cite\_start]**库搜索路径**：`LD_LIBRARY_PATH` 包含 `/usr/local/corex/lib` [cite: 1]，确保了在未设置 RPATH 的情况下也能找到 SDK 库。
+  - **探测命令与结果**：
+
+    ```bash
+    env | grep "COREX"
+    COREX_HOME=/usr/local/corex
+    ```
+
+**2. 驱动层转发机制 (Driver Shim Mechanism)**
+
+  - **关键性**：**P0**
+  - **信息解析**：
+      - [cite\_start]**转发确认**：`libcuda.so` (即 NVIDIA Driver API 的替代品) 显式依赖于 `libixthunk.so` [cite: 1]。
+      - **架构意义**：这是智铠 SDK 兼容 CUDA 的核心枢纽。它拦截了如 `cuMemAlloc`、`cuLaunchKernel` 等标准驱动调用，并通过 `libixthunk` 将其转换为发往 `iluvatar.ko` 内核模块的指令。
+  - **探测命令与结果**：
+
+    ```bash
+    ldd /usr/local/corex/lib/libcuda.so
+    libixthunk.so => /usr/local/corex/lib/libixthunk.so
+    ```
+
+**3. 运行时版本伪装 (Runtime Version Masquerading)**
+
+  - **关键性**：**P0**
+  - **信息解析**：
+      - **金丝雀测试**：一个标准的 CUDA Runtime API 程序成功编译并运行。
+      - [cite\_start]**版本欺骗**：系统返回 **Runtime Version: 10020** 和 **Driver Version: 10020** [cite: 1]。
+      - **结论**：SDK 成功将自己伪装成了 **CUDA 10.2** 环境。这对于雷达信号处理算法库（如某些开源的 FFT 实现）至关重要，因为它们往往会对 CUDA 版本进行硬编码检查。
+  - **探测命令与结果**：
+
+    ```bash
+    ./test_runtime
+    Detected CUDA Runtime Version: 10020
+    Detected CUDA Driver Version:  10020
+    ```
+
+**4. 运行时库依赖策略 (Runtime Library Strategy)**
+
+  - **关键性**：**P2**
+  - **信息解析**：
+      - [cite\_start]**依赖链**：`libcudart.so` 仅依赖标准系统库 (`libc`, `libstdc++` 等) [cite: 1]。
+      - **推论**：不同于 `libcuda.so`，`libcudart` 可能设计得更为轻量，仅负责 API 的参数封装和管理，具体的硬件操作可能全部下沉到了驱动层库或通过动态加载实现。
+  - **探测命令与结果**：
+
+    ```bash
+    ldd /usr/local/corex/lib/libcudart.so
+    (无 libix* 显式依赖)
+    ```
--- a/系统基座文件/1/1.3/1.3.3
+++ b/系统基座文件/1/1.3/1.3.3
@@ -0,0 +1,96 @@
+---
+tags: []
+date created: 星期三, 十一月 19日 2025, 5:34:23 下午
+date modified: 星期三, 十一月 19日 2025, 6:29:11 晚上
+---
+
+# 1.3.3 管理与监控接口 (Management Interfaces)
+
+**1. 基础状态概览 (Basic Status Overview)**
+
+  - **关键性**：**P0**
+  - **信息解析**：
+      - **型号识别**：**Iluvatar MR-V100**。这是智铠的高端训练/推理卡。
+      - **显存容量**：**32 GB** (32768 MiB)。对于雷达信号处理（如动目标检测 MTI、脉冲压缩），这是一个非常充裕的显存池，允许处理超大的相干处理间隔（CPI）数据块。
+      - **热状态**：当前温度 **60°C**，风扇状态不可读 (N/A)。鉴于功耗仅 **41W** (空载)，温度略高，可能是被动散热或机房环境温度较高。
+  - **探测命令与结果**：
+
+    ```bash
+    /usr/local/corex/bin/ixsmi
+    | 0    Iluvatar MR-V100         | 00000001:01:00.0     |
+    | N/A  60C   P0    41W / 150W   | 64MiB / 32768MiB     |
+    ```
+
+**2. ECC 错误监控能力 (ECC Monitoring Capability)**
+
+  - **关键性**：**P1**
+  - **信息解析**：
+      - **查询失败**：`Field "ecc.errors…" is not a valid field`。
+      - **深度解读**：这意味着我们无法通过标准 SMI 命令监控显存的单比特翻转（Single Bit Error）。对于雷达这类对数据准确性敏感的系统，这是一个**盲区**。
+      - **行动项**：在应用层代码中增加自校验逻辑（如周期性内存完整性测试），或联系厂商询问私有 ECC 查询接口。
+  - **探测命令与结果**：
+
+    ```bash
+    ixsmi --query-gpu=ecc…
+    Field … is not a valid field to query.
+    ```
+
+**3. 频率与功耗详情 (Clock & Power)**
+
+  - **关键性**：**P1**
+  - **信息解析**：
+      - **核心频率**：当前 **1500 MHz**，最大 **1600 MHz**。GPU 几乎运行在全速状态（P0 态），性能释放良好。
+      - **功耗墙**：默认上限 **150W**。相比 NVIDIA V100 (250W) 或 A100 (400W)，这张卡功耗较低，适合边缘侧雷达站部署。
+      - **温度阈值**：**95°C** 开始降频 (Slowdown)，**105°C** 强制关机 (Shutdown)。当前 60°C 距离热墙尚远。
+  - **探测命令与结果**：
+
+    ```bash
+    ixsmi -q -d CLOCK,POWER,TEMPERATURE
+    GPU Power Draw                  : 41 W
+    GPU Max Operating Temp          : 95 C
+    SM                              : 1500 MHz
+    ```
+
+**4. NUMA 拓扑亲和性 (NUMA Affinity)**
+
+  - **关键性**：**P0**
+  - **信息解析**：
+      - **绑定关系**：GPU 0 绑定到 **NUMA Node 1**。
+      - **核心范围**：**CPU 16-31**。
+      - **工程约束**：在编写多线程雷达处理程序时，**严禁**将主处理线程调度到 CPU 0-15。若发生跨 Node 内存拷贝，带宽将受到 QPI/UPI 总线的严重制约（增加 20%-40% 的延迟）。必须使用 `numactl --cpunodebind=1` 或 `pthread_setaffinity_np` 强制绑定。
+  - **探测命令与结果**：
+
+    ```bash
+    ixsmi topo -m
+    GPU0     X      16-31            1
+    ```
+
+**5. 进程监控 (Process Monitoring)**
+
+  - **关键性**：**P2**
+  - **信息解析**：
+      - **状态**：当前无运行进程 (`No running processes found`)。
+      - **结论**：环境“干净”，无后台训练任务或僵尸进程占用显存，适合进行基准测试（Benchmark）或新业务部署。
+  - **探测命令与结果**：
+
+    ```bash
+    ixsmi pmon
+    (No entries)
+    ```
+
+**6. 关键风险应对 (Critical Risk Response)**
+
+**6.1 运维盲区：ECC 监控缺失**
+
+  - **风险定性**：**P1 (可靠性风险)**。`ixsmi` 工具当前不支持查询 ECC 错误字段，导致系统无法感知显存物理位翻转（Bit Flip），在雷达长时运行中存在数据静默错误的隐患。
+  - **应对策略**：已向厂商咨询底层查询接口。在获得官方工具前，建议在应用层增加关键数据块（如原始回波数据）的 CRC32 完整性校验。
+
+**6.2 架构陷阱：NUMA 拓扑失配**
+
+  - **风险定性**：**P0 (性能风险)**。`ixsmi topo` 确认 GPU 绑定在 **NUMA Node 1 (CPU 16-31)**。若程序默认在 Node 0 启动，跨 CPU 访问显存将导致 QPI/UPI 总线瓶颈，延迟增加且不可控。
+  - **执行修正**：必须使用 `numactl` 强制绑定 CPU 亲和性。针对您的构建环境，启动命令应规范为：
+
+    ```bash
+    # 强制将进程绑定到 NUMA Node 1 (Core 16-31)
+    numactl --cpunodebind=1 --membind=1 /home/Radar/workspace/signal-processing-demo/build/bin/main_app
+    ```
--- a/系统基座文件/1/1.3/1.3.4
+++ b/系统基座文件/1/1.3/1.3.4
@@ -0,0 +1,69 @@
+---
+tags: []
+date created: 星期三, 十一月 19日 2025, 6:38:56 晚上
+date modified: 星期三, 十一月 19日 2025, 6:39:15 晚上
+---
+
+# 1.3.4 核心数学加速库 (Core Math Libraries)
+
+**1. 数学库物理实体与映射 (Physical Library Mapping)**
+
+  - **关键性**：**P0**
+  - **信息解析**：
+      - **文件存在性**：`libcufft.so` (FFT) 和 `libcublas.so` (BLAS) 均存在于 `/usr/local/corex/lib`。
+      - **版本伪装策略**：
+          - `libcublas.so` -\> 链接至 `libcublas.so.2.3.254`（伪装 CUDA 10.2）。
+          - `libcufft.so` -\> 链接至 `libcufft.so.1.2.89`（伪装 CUDA 10.1）。
+      - **容量分析**：
+          - `libcufft` 体积高达 **412MB**，`libcublas` 为 **133MB**。
+          - **结论**：如此巨大的体积表明这**绝不是**简单的 API 转发层（Shim），而是包含完整数学算法实现的**重编译版本**（Native Implementation）。
+  - **探测命令与结果**：
+
+    ```bash
+    ls -lh /usr/local/corex/lib/libcufft.so*
+    -rwxr-xr-x … 412M … libcufft.so.1.2.89
+    ```
+
+**2. 二进制身份指纹 (Binary Identity)**
+
+  - **关键性**：**P1**
+  - **信息解析**：
+      - **构建来源**：`strings` 命令输出显示包含 `iluvatar.version` 和 `clang version 18.1.8 (4.3.8 …)`。
+      - **深度解读**：这证实了该库是由天数智芯（Iluvatar）使用其自研工具链（Clang 18 base）从源码重新编译的，而非 NVIDIA 的二进制文件。这意味着其底层实现已针对智铠 GPU 的 VLIW 架构进行了特定优化。
+  - **探测命令与结果**：
+
+    ```bash
+    strings … | grep "iluvatar"
+    iluvatar.version
+    SDK Version
+    ```
+
+**3. 开发头文件状态 (Header Availability)**
+
+  - **关键性**：**P0**
+  - **信息解析**：
+      - **状态**：`cufft.h` 和 `cublas_v2.h` 均存在且大小正常。
+      - **兼容性**：这意味着现有的雷达信号处理代码（通常包含这两个头文件）无需修改 `#include` 路径即可直接编译。
+  - **探测命令与结果**：
+
+    ```bash
+    ls -l …/include/cufft.h …/include/cublas_v2.h
+    -rwxr-xr-x … 13033 … cufft.h
+    ```
+
+**4. 功能性金丝雀测试 (Functional Canary Test)**
+
+  - **关键性**：**P0 (Critical)**
+  - **信息解析**：
+      - **测试内容**：同时调用 `cufftPlan1d` (创建 FFT 句柄) 和 `cublasCreate` (创建矩阵句柄)。
+      - **测试结果**：
+          - `cuFFT Plan1d: Success`
+          - `cuBLAS Create: Success`
+      - **审计结论**：**数学库功能完好**。链接器成功找到了库，且初始化函数能正确与驱动交互并分配资源。这是验证 SDK 可用性的里程碑。
+  - **探测命令与结果**：
+
+    ```bash
+    ./test_math
+    cuFFT Plan1d: Success
+    cuBLAS Create: Success
+    ```
--- a/系统基座文件/1/1.3/1.3.5
+++ b/系统基座文件/1/1.3/1.3.5
@@ -0,0 +1,52 @@
+---
+tags: 
+date created: 星期三, 十一月 19日 2025, 6:50:09 晚上
+date modified: 星期三, 十一月 19日 2025, 6:50:20 晚上
+---
+
+# 1.3.5 开发者头文件与生态 (Developer Headers & Ecosystem)
+
+**审计综述**：
+本环节确认了 SDK 对现代 C++ 开发生态的支持能力。最关键的发现是 **Thrust 模板库（v1.9.7）** 的完整存在且功能正常，这意味着雷达信号处理算法可以利用类似 STL 的高层抽象进行开发，而无需手写繁琐的 CUDA Kernel。同时，**FP16** 和 **标准数学函数** 的支持，保障了从 NVIDIA 平台迁移代码时的源码级兼容性。
+
+**1. Thrust 模板库完备性 (Thrust Template Library)**
+
+  - **关键性**：**P0**
+  - **信息解析**：
+      - **版本指纹**：检测到 `THRUST_VERSION 100907`，对应 **Thrust v1.9.7**。这是一个非常成熟且广泛使用的版本（对应 CUDA 10.x 时代）。
+      - **后端架构**：`THRUST_DEVICE_SYSTEM` 宏确认为 `CUDA` 后端。这表明智铠 SDK 实现了对 NVIDIA Thrust 接口的底层拦截与适配，开发者可以使用 `thrust::sort`, `thrust::reduce` 等高阶原语。
+      - **功能验证**：金丝雀测试（Canary Test）成功在 Device 端完成了 Vector 数据拷贝与排序，证明 C++ 模板元编程在 `Clang++` 编译器下能正确展开并生成 GPU 指令。
+  - **探测依据**：
+
+    ```bash
+    grep "THRUST_VERSION" /usr/local/corex/include/thrust/version.h
+    #define THRUST_VERSION 100907
+    ls -d /usr/local/corex/include/thrust
+    /usr/local/corex/include/thrust
+    ```
+
+**2. 混合精度计算支持 (Mixed Precision / FP16)**
+
+  - **关键性**：**P1**
+  - **信息解析**：
+      - **头文件状态**：`/usr/local/corex/include/cuda_fp16.h` 存在且文件大小正常（约 110KB）。
+      - **业务价值**：在雷达数据存储（IQ 采样）和部分波束形成算法中，使用半精度（FP16）可将显存带宽需求降低 50%。该头文件的存在意味着我们可以定义 `__half` 类型并调用 `__hadd`, `__hmul` 等原生指令。
+  - **探测依据**：
+
+    ```bash
+    ls -l /usr/local/corex/include/cuda_fp16.h
+    -rwxr-xr-x 1 root root 110679 …
+    ```
+
+**3. 设备端数学函数库 (Device Math Functions)**
+
+  - **关键性**：**P1**
+  - **信息解析**：
+      - **CRT 支持**：检测到 `crt/math_functions.h` (337KB) 和 `math_functions.h`。
+      - **兼容性意义**：这些头文件映射了 C 标准数学库（如 `sinf`, `powf`, `sqrtf`）到 GPU 的硬件指令（SFU Special Function Units）。对于涉及大量三角函数运算的雷达信号处理（如相位解缠），这是必不可少的基础设施。
+  - **探测依据**：
+
+    ```bash
+    ls -l /usr/local/corex/include/crt/math_functions.h
+    -rwxr-xr-x 1 root root 337836 …
+    ```
--- a/系统基座文件/1/1.3/1.3.6
+++ b/系统基座文件/1/1.3/1.3.6
@@ -0,0 +1,49 @@
+---
+tags: []
+date created: 星期三, 十一月 19日 2025, 6:59:57 晚上
+date modified: 星期三, 十一月 19日 2025, 7:02:54 晚上
+---
+
+# 1.3.6 官方示例与构建范式 (Official Samples & Build Patterns)
+
+**审计综述**：
+由于系统中缺失官方 SDK 示例代码（`/usr/local/corex/samples` 不存在），我们将 **用户验证过的工程配置 (`SignalProject`)** 确立为该环境下的**标准构建范式（Golden Build Pattern）**。
+
+**1. 核心构建策略：显式异构分离 (Explicit Heterogeneous Separation)**
+- **关键性**：**P0**
+- **范式解析**：
+    - [cite_start]**Host 编译器**：显式锁定为 `/usr/bin/g++`。这是为了确保与 OS 内核（GCC 7.3 构建）的 ABI 完美兼容，避免 `libstdc++` 符号冲突。
+    - [cite_start]**Device 编译器**：通过自定义变量 `CLANG_CUDA_COMPILER` 指向 `clang++`。这表明构建系统**没有**使用 CMake 原生的 `LANGUAGES CUDA` 支持（通常会自动寻找 nvcc），而是采用“C++ 项目 + 手动管理 GPU 编译规则”的模式。
+    - [cite_start]**语言标准**：`project(SignalProject LANGUAGES CXX)`。项目本质被定义为 C++ 工程，GPU 代码被视为一种特殊的 C++ 扩展（ivcore/cuda）。
+
+**2. SDK 路径管理 (SDK Path Management)**
+- **关键性**：**P1**
+- **范式解析**：
+    - [cite_start]**硬编码路径**：SDK 根目录被锚定在 `/usr/local/corex`。
+    - [cite_start]**头文件搜索**：显式定义 `COREX_INC_PATH` 用于查找 `cuda_runtime.h`。这与我们在 **1.3.5** 中发现的头文件位置一致。
+    - [cite_start]**库文件搜索**：显式定义 `COREX_LIB_PATH`，配合 **1.2.3** 中验证过的 RPATH 机制，构成了完整的链接闭环。
+
+**3. 依赖管理范式 (Dependency Management Pattern)**
+- **关键性**：**P2**
+- **范式解析**：
+    - [cite_start]**GoogleTest 集成**：使用 `FetchContent` 在线拉取 `v1.14.0` 版本的 GTest。这意味着构建环境需要互联网连接，且该版本的 GTest 与当前的 GCC 7.3 / Clang 18 混合环境兼容。
+
+**4. 结论与建议**
+- **当前状态**：构建范式已通过实战验证。
+- **行动项**：后续开发所有新模块时，**必须严格复制**此 `CMakeLists.txt` 中的编译器设置部分（特别是 `set(CMAKE_CXX_COMPILER …)` 和 `set(CLANG_CUDA_COMPILER …)`），任何试图引入 `enable_language(CUDA)` 或移除 GCC 显式指定的行为都极可能导致构建失败。
+
+---
+
+### 1.3 章节最终总结：GPGPU 软件开发套件
+
+至此，我们完成了对 **1.3 GPGPU 软件开发套件** 的全方位审计：
+
+1. **驱动 (Driver)**：`iluvatar.ko` (v4.3.8) 加载正常，但 NUMA 绑定需人工干预。
+2. **运行时 (Runtime)**：成功伪装为 **CUDA 10.2**，全链路金丝雀测试通过。
+3. **数学库 (Math)**：`cuFFT` / `cuBLAS` 的智铠原生重构版存在且可用，这是雷达业务的基石。
+4. **开发生态 (Ecosystem)**：`Thrust 1.9.7` 模板库就绪，支持高效率 C++ 开发。
+5. **构建范式 (Build)**：确立了 **"Host(GCC) + Device(Clang) + CoreX SDK"** 的混合编译标准。
+
+**风险提示**：
+- **ECC 监控缺失**：需在软件层增加数据校验。
+- **NUMA 拓扑陷阱**：必须使用 `numactl` 或代码级绑定锁死 CPU 16-31。