Files
Inbox/系统基座文件/3/3.1/3.1 异构协同模型与职责边界 (Heterogeneous Collaboration Model & Responsibility Boundary).md
2025-12-11 07:24:36 +08:00

42 lines
3.1 KiB
Markdown
Raw Blame History

This file contains ambiguous Unicode characters

This file contains Unicode characters that might be confused with other characters. If you think that this is intentional, you can safely ignore this warning. Use the Escape button to reveal them.

---
tags: []
date created: 星期四, 十一月 27日 2025, 11:54:57 中午
date modified: 星期四, 十一月 27日 2025, 11:44:56 晚上
---
# 3.1 异构协同模型与职责边界 (Heterogeneous Collaboration Model & Responsibility Boundary)
- **设计目标**最大化利用国产异构硬件特性Feiteng 的逻辑控制能力 + Iluvatar 的并行浮点能力),同时最小化 PCIe 总线上的交互频率。
## 3.1.1 Device 侧驻留图谱:信号处理流水线 (Device-Resident Workload: Signal Processing Pipeline)
- **核心指向**:定义必须**“死锁”在 GPU 显存**中运行的算法全集。严禁数据在中间步骤回流 CPU。
- **算法栈与库选型**
- **波束形成 (DBF)**:利用 **cuBLAS** (Vendor) 进行矩阵乘法加速。
- **脉冲压缩 & 多普勒处理**:利用 **cuFFT** (Vendor) 执行批量 FFT。
- **恒虚警检测 (CFAR)**:利用 **Thrust** (Open Source/Vendor SDK) 的 `transform``stencil` 算法实现并行滑窗检测,避免手写复杂 Kernel。
- **边界法则****“GB 进KB 出”**。输入是原始 I/Q (GB 级),输出是点迹列表 (KB 级)。中间过程(如 RDM 矩阵)绝不离开显存。
## 3.1.2 Host 侧驻留图谱:逻辑控制与后处理 (Host-Resident Workload: Logic & Post-Processing)
- **核心指向**:定义由 CPU 负责的标量计算和状态管理任务。
- **开源库集成**
- **数据关联与滤波 (Tracking)**:利用 **Eigen3** (Open Source) 实现卡尔曼滤波Kalman Filter和概率数据互联PDA算法。Eigen 的向量化指令NEON能极好地适配飞腾 CPU。
- **全链路日志与审计**:集成 **spdlog****glog** (Open Source),在控制路径上打点,记录任务调度延迟和状态变更,而非自己造日志轮子。
- **参数配置管理**:集成 **yaml-cpp** (Open Source) 解析雷达波位表和 CFAR 阈值参数。
## 3.1.3 宏指令交互接口 (Macro-Instruction Interface)
- **核心指向**:定义 Host 指挥 Device 的“语言”。摒弃微观的“启动这个 Kernel”式调用转为 **“宏指令 (Macro-Op)”** 模式。
- **指令结构**:定义 `RadarProcessingJob` 结构体。
- 包含:`BatchID``WaveformParams`(波形参数)、`AlgoConfig`(算法开关)。
- **机制**CPU 只需下发一个 Job 对象GPU 侧的 **“执行器 (Executor)”** 自动展开为数十个 Kernel 的调用序列。这极大减少了 Host 端的调度抖动。
## 3.1.4 算力回流边界CFAR 截断点 (The "CFAR Cutoff" Boundary)
- **核心指向**:精确定义数据从 GPU 流回 CPU 的唯一物理与逻辑时刻。
- **截断策略**
- **物理点**CFAR 检测完成后。此时数据量从“全图像素”坍缩为“稀疏点迹”。
- **数据转换**:在 GPU 上直接使用 **Thrust**`copy_if` 算子,将满足阈值的点收集到连续内存块(`DetectionResult` 数组),然后一次性 DMA 回传。
- **反模式警示**:严禁将整个 2D 距离 - 多普勒图Range-Doppler Map传回 CPU 做检测,这会瞬间击穿 PCIe x8 带宽。