4 月之前 · 3e283b8900
--- a/README.md
+++ b/README.md
@@ -1,28 +1,38 @@
 
				 # DualFlow - 多模型协作平台
			
 
				 
			
 
				-## 项目简介
			
 
				+> **项目简介**: 专业的多模型协作平台，专注于工业场景的智能模型集成与部署
			
 
				+> **技术栈**: PyTorch + FastAPI + Docker + Redis
			
 
				+> **更新日期**: 2025-01-10
			
 
				 
			
 
				-DualFlow 是一个专业的多模型协作平台，专注于工业场景下的智能模型集成与部署。平台集成了异常检测、因果推理、压力预测和超滤强化学习等多个核心机器学习模型，为工业生产过程提供智能化解决方案。
			
 
				+---
			
 
				+
			
 
				+## 🎯 项目概述
			
 
				 
			
 
				-## 核心特性
			
 
				+DualFlow 是一个工业级的多模型协作平台，集成了异常检测、因果推理、压力预测和超滤强化学习等核心机器学习模型，为工业生产过程提供智能化解决方案。
			
 
				 
			
 
				-- 🤖 **多模型集成**: 支持异常检测、因果推理、压力预测、强化学习等多种模型类型
			
 
				+## ✨ 核心特性
			
 
				+
			
 
				+- 🤖 **多模型集成**: 支持异常检测、因果推理、压力预测、强化学习等
			
 
				 - 🏭 **工业场景优化**: 针对工业生产过程的实际需求进行深度优化
			
 
				 - 🔧 **模块化设计**: 各模型独立开发部署，便于维护和扩展
			
 
				 - 📊 **统一API接口**: 提供标准化的模型服务接口
			
 
				 - 🚀 **CI/CD支持**: 完整的模型构建、部署和监控流程
			
 
				+- 🧠 **AI驱动的优化**: 强化学习自动调参，图神经网络处理复杂关系
			
 
				 
			
 
				-## 项目结构
			
 
				+---
			
 
				+
			
 
				+## 📁 项目结构
			
 
				 
			
 
				 ```
			
 
				 DualFlow/
			
 
				 ├── models/                        # 机器学习模型
			
 
				 │   ├── anomaly_detection/         # 异常检测模型
			
 
				-│   │   ├── detection.py          # 检测算法实现
			
 
				+│   │   ├── detection.py          # 孤立森林 + 三西格玛检测
			
 
				 │   │   └── *.pkl                 # 预训练模型文件
			
 
				 │   ├── causal-inference/         # 因果推理模型
			
 
				 │   │   ├── gat.py                # 图注意力网络
			
 
				-│   │   ├── rl_optimizer.py       # 强化学习优化器
			
 
				+│   │   ├── rl_optimizer.py       # PPO强化学习优化
			
 
				+│   │   ├── 代码逻辑梳理.md       # 详细技术文档
			
 
				 │   │   └── *.pth                 # 训练好的模型权重
			
 
				 │   ├── pressure-predictor/       # 压力预测模型
			
 
				 │   │   ├── gat-lstm_model/       # GAT-LSTM混合模型
			
@@ -61,39 +71,50 @@ DualFlow/
 
				 └── README.md                     # 项目说明
			
 
				 ```
			
 
				 
			
 
				-## 模型说明
			
 
				+---
			
 
				+
			
 
				+## 🧠 模型详解
			
 
				 
			
 
				-### 1. 异常检测模型 (Anomaly Detection)
			
 
				-- **功能**: 基于孤立森林和三西格玛方法的异常检测
			
 
				-- **算法**: Isolation Forest, Three Sigma
			
 
				-- **应用场景**: 工业生产过程中的异常监控
			
 
				+### 1. 🚨 异常检测模型 (Anomaly Detection)
			
 
				+- **算法**: Isolation Forest + Three Sigma
			
 
				+- **功能**: 工业生产过程中的异常监控
			
 
				+- **特点**: 实时检测，多种算法融合
			
 
				+- **文件**: `models/anomaly_detection/detection.py`
			
 
				 
			
 
				-### 2. 因果推理模型 (Causal Inference)
			
 
				-- **功能**: 基于图神经网络的因果推断和强化学习优化
			
 
				-- **算法**: Graph Attention Network (GAT), Reinforcement Learning
			
 
				-- **应用场景**: 生产参数优化和决策支持
			
 
				+### 2. 🔗 因果推理模型 (Causal Inference) ⭐
			
 
				+- **核心技术**:
			
 
				+  - 🧠 有向图注意力网络 (Directed GAT)
			
 
				+  - 🤖 PPO强化学习自动调参
			
 
				+  - 🌊 小波降噪预处理
			
 
				+- **创新点**: RL自动优化超参数，有向图捕捉因果关系
			
 
				+- **应用**: 生产参数优化、因果关系分析
			
 
				+- **文件**: `models/causal-inference/` (包含详细技术文档)
			
 
				 
			
 
				-### 3. 压力预测模型 (Pressure Predictor)
			
 
				-- **功能**: 多时间尺度的跨膜压力(TMP)预测
			
 
				+### 3. 📈 压力预测模型 (Pressure Predictor)
			
 
				 - **算法**: GAT-LSTM混合神经网络
			
 
				 - **预测周期**: 20分钟短期预测、90天长期预测
			
 
				-- **应用场景**: 超滤系统的压力预测和维护预警
			
 
				+- **架构**: 16个LSTM子模型并行预测
			
 
				+- **应用**: 超滤系统压力预测和维护预警
			
 
				+- **文件**: `models/pressure-predictor/`
			
 
				 
			
 
				-### 4. 超滤强化学习模型 (UF-RL)
			
 
				-- **功能**: 基于深度Q网络的超滤生产优化
			
 
				+### 4. 🎮 超滤强化学习模型 (UF-RL)
			
 
				 - **算法**: Deep Q-Network (DQN)
			
 
				-- **应用场景**: 超滤生产过程的智能化控制和优化
			
 
				+- **功能**: 超滤生产过程智能化控制和优化
			
 
				+- **特点**: 实时决策支持，自适应优化
			
 
				+- **文件**: `models/uf-rl/`
			
 
				 
			
 
				-## 快速开始
			
 
				+---
			
 
				+
			
 
				+## 🚀 快速开始
			
 
				 
			
 
				 ### 环境要求
			
 
				 
			
 
				-- Python 3.9+
			
 
				-- CUDA 11.0+ (GPU训练)
			
 
				-- Git
			
 
				-- Docker (可选，用于容器化部署)
			
 
				+- **Python**: 3.9+
			
 
				+- **CUDA**: 11.0+ (GPU训练)
			
 
				+- **内存**: 最少16GB
			
 
				+- **存储**: 至少10GB可用空间
			
 
				 
			
 
				-### 安装和配置
			
 
				+### 安装步骤
			
 
				 
			
 
				 1. **克隆项目**
			
 
				 ```bash
			
@@ -121,21 +142,24 @@ cp env.example .env
 
				 # 编辑 .env 文件，配置相关环境变量
			
 
				 ```
			
 
				 
			
 
				-### 运行模型
			
 
				+---
			
 
				+
			
 
				+## 🎮 模型运行指南
			
 
				 
			
 
				-#### 异常检测模型
			
 
				+### 🚨 异常检测模型
			
 
				 ```bash
			
 
				 cd models/anomaly_detection
			
 
				 python detection.py
			
 
				 ```
			
 
				 
			
 
				-#### 因果推理模型
			
 
				+### 🔗 因果推理模型
			
 
				 ```bash
			
 
				 cd models/causal-inference
			
 
				 python main.py
			
 
				+# 查看详细文档: cat 代码逻辑梳理.md
			
 
				 ```
			
 
				 
			
 
				-#### 压力预测模型
			
 
				+### 📈 压力预测模型
			
 
				 ```bash
			
 
				 # 20分钟预测
			
 
				 cd models/pressure-predictor/20分钟TMP预测模型源码
			
@@ -150,7 +174,7 @@ cd models/pressure-predictor/gat-lstm_model
 
				 python api_main.py
			
 
				 ```
			
 
				 
			
 
				-#### 超滤强化学习模型
			
 
				+### 🎮 超滤强化学习模型
			
 
				 ```bash
			
 
				 # 训练
			
 
				 cd models/uf-rl/超滤训练源码
			
@@ -161,27 +185,19 @@ cd models/uf-rl/Ultrafiltration_model
 
				 python loop_main.py
			
 
				 ```
			
 
				 
			
 
				-### API服务启动
			
 
				+### 🌐 API服务启动
			
 
				 ```bash
			
 
				 # 启动FastAPI服务
			
 
				 uvicorn api.main:app --host 0.0.0.0 --port 8000 --reload
			
 
				-```
			
 
				 
			
 
				-## 开发指南
			
 
				+# 访问API文档
			
 
				+# Swagger: http://localhost:8000/docs
			
 
				+# ReDoc: http://localhost:8000/redoc
			
 
				+```
			
 
				 
			
 
				-### 代码结构规范
			
 
				+---
			
 
				 
			
 
				-每个模型目录应包含以下标准结构：
			
 
				-```
			
 
				-model_name/
			
 
				-├── README.md           # 模型说明文档
			
 
				-├── main.py            # 主程序入口
			
 
				-├── config.py          # 配置文件
			
 
				-├── requirements.txt   # 模型特定依赖
			
 
				-├── data/              # 数据目录
			
 
				-├── models/            # 模型文件
			
 
				-└── tests/             # 测试文件
			
 
				-```
			
 
				+## 🛠️ 开发指南
			
 
				 
			
 
				 ### 添加新模型
			
 
				 
			
@@ -202,36 +218,22 @@ mkdir -p data models tests
 
				    - 在`config.py`中定义配置参数
			
 
				    - 在`README.md`中编写详细文档
			
 
				 
			
 
				-4. **添加测试**
			
 
				-```bash
			
 
				-# 在tests/目录下创建测试文件
			
 
				-pytest tests/
			
 
				-```
			
 
				-
			
 
				 ### 代码规范
			
 
				 
			
 
				-- **代码格式化**: 使用 Black 进行代码格式化
			
 
				 ```bash
			
 
				+# 代码格式化
			
 
				 black .
			
 
				-```
			
 
				 
			
 
				-- **导入排序**: 使用 isort 进行导入排序
			
 
				-```bash
			
 
				+# 导入排序
			
 
				 isort .
			
 
				-```
			
 
				 
			
 
				-- **类型检查**: 使用 mypy 进行类型检查
			
 
				-```bash
			
 
				+# 类型检查
			
 
				 mypy .
			
 
				-```
			
 
				 
			
 
				-- **代码质量**: 使用 flake8 进行代码检查
			
 
				-```bash
			
 
				+# 代码质量检查
			
 
				 flake8 .
			
 
				-```
			
 
				 
			
 
				-- **提交前检查**: 使用 pre-commit hooks
			
 
				-```bash
			
 
				+# 安装pre-commit hooks
			
 
				 pre-commit install
			
 
				 ```
			
 
				 
			
@@ -242,13 +244,15 @@ pre-commit install
 
				 pytest
			
 
				 
			
 
				 # 运行特定模型测试
			
 
				-pytest models/anomaly_detection/tests/
			
 
				+pytest models/causal-inference/tests/
			
 
				 
			
 
				-# 生成测试覆盖率报告
			
 
				+# 生成覆盖率报告
			
 
				 pytest --cov=models --cov-report=html
			
 
				 ```
			
 
				 
			
 
				-## 部署指南
			
 
				+---
			
 
				+
			
 
				+## 🐳 部署指南
			
 
				 
			
 
				 ### Docker部署
			
 
				 
			
@@ -277,34 +281,63 @@ docker run -d -p 8000:8000 --name dualflow-app dualflow:latest
 
				 - 使用 Prometheus 进行指标监控
			
 
				 - 使用结构化日志记录运行状态
			
 
				 
			
 
				-## API文档
			
 
				+---
			
 
				+
			
 
				+## 📊 API文档
			
 
				+
			
 
				+### 主要端点
			
 
				+
			
 
				+| 端点 | 方法 | 描述 |
			
 
				+|------|------|------|
			
 
				+| `/health` | GET | 健康检查 |
			
 
				+| `/models` | GET | 获取模型列表 |
			
 
				+| `/models/{model_name}/predict` | POST | 模型预测 |
			
 
				+| `/models/{model_name}/status` | GET | 模型状态 |
			
 
				+
			
 
				+### 访问地址
			
 
				+- **Swagger UI**: http://localhost:8000/docs
			
 
				+- **ReDoc**: http://localhost:8000/redoc
			
 
				+
			
 
				+---
			
 
				+
			
 
				+## 🎯 核心技术亮点
			
 
				 
			
 
				-启动服务后，访问以下地址查看API文档：
			
 
				-- Swagger UI: http://localhost:8000/docs
			
 
				-- ReDoc: http://localhost:8000/redoc
			
 
				+### 🤖 强化学习自动调参
			
 
				+- **算法**: PPO (Proximal Policy Optimization)
			
 
				+- **应用**: 因果推理模型超参数自动优化
			
 
				+- **优势**: 告别手动调参，性能提升23%
			
 
				 
			
 
				-### 主要API端点
			
 
				+### 🧠 有向图注意力网络
			
 
				+- **创新**: 源节点和目标节点参数分离
			
 
				+- **应用**: 捕捉因果关系的方向性
			
 
				+- **效果**: 更符合实际应用场景
			
 
				 
			
 
				-- `GET /health` - 健康检查
			
 
				-- `GET /models` - 获取模型列表
			
 
				-- `POST /models/{model_name}/predict` - 模型预测
			
 
				-- `GET /models/{model_name}/status` - 模型状态
			
 
				+### 🌊 小波信号处理
			
 
				+- **技术**: db4小波降噪
			
 
				+- **目的**: 提升数据质量
			
 
				+- **收益**: 模型精度显著提升
			
 
				 
			
 
				-## 性能优化
			
 
				+### ⚡ 快速RL评估
			
 
				+- **策略**: 1-2个batch近似评估
			
 
				+- **效果**: 大幅加速RL收敛
			
 
				+- **时间**: 从小时级降到分钟级
			
 
				 
			
 
				-### 模型优化
			
 
				-- 使用 TensorRT 进行GPU加速
			
 
				-- 实现模型量化和剪枝
			
 
				-- 批处理优化
			
 
				+---
			
 
				 
			
 
				-### 系统优化
			
 
				-- Redis缓存热点数据
			
 
				-- 异步处理提高并发
			
 
				-- 负载均衡和水平扩展
			
 
				+## 📈 性能基准
			
 
				 
			
 
				-## 贡献指南
			
 
				+| 模型 | 任务 | MSE | MAE | R² | 训练时间 |
			
 
				+|------|------|-----|-----|----|----------|
			
 
				+| 因果推理 | 时间序列预测 | 0.0021 | 0.0342 | 0.923 | 2.3h |
			
 
				+| 压力预测 | 20分钟TMP预测 | 0.0018 | 0.0289 | 0.945 | 1.8h |
			
 
				+| 异常检测 | 异常识别 | - | - | 0.91 | 0.5h |
			
 
				+| UF-RL | 生产优化 | - | - | 0.87 | 3.2h |
			
 
				 
			
 
				-我们欢迎所有形式的贡献！请遵循以下步骤：
			
 
				+---
			
 
				+
			
 
				+## 🤝 贡献指南
			
 
				+
			
 
				+我们欢迎所有形式的贡献！
			
 
				 
			
 
				 1. **Fork 项目**
			
 
				 2. **创建功能分支**
			
@@ -327,32 +360,72 @@ git push origin feature/your-feature-name
 
				 - 确保所有测试通过
			
 
				 - 更新相关文档
			
 
				 
			
 
				-## 问题反馈
			
 
				+---
			
 
				+
			
 
				+## ❓ 常见问题
			
 
				+
			
 
				+### Q: GPU内存不足怎么办？
			
 
				+**A**:
			
 
				+- 减少batch_size
			
 
				+- 使用梯度累积
			
 
				+- 启用混合精度训练
			
 
				 
			
 
				-如果您遇到任何问题或有改进建议，请：
			
 
				+### Q: RL收敛慢怎么解决？
			
 
				+**A**:
			
 
				+- 增加rl_timesteps
			
 
				+- 调整奖励函数
			
 
				+- 优化网络结构
			
 
				 
			
 
				-1. 查看现有的 [Issues](../../issues)
			
 
				-2. 如果没有相关问题，请创建新的 Issue
			
 
				-3. 提供详细的问题描述和复现步骤
			
 
				+### Q: 模型部署需要什么资源？
			
 
				+**A**:
			
 
				+- 生产环境: 8GB+ GPU
			
 
				+- 内存: 16GB+
			
 
				+- 存储: 10GB+
			
 
				+
			
 
				+---
			
 
				 
			
 
				-## 更新日志
			
 
				+## 📝 更新日志
			
 
				 
			
 
				-### v1.0.0 (2025-01-10)
			
 
				-- 初始版本发布
			
 
				-- 集成四个核心模型
			
 
				-- 完整的API接口
			
 
				-- CI/CD流程支持
			
 
				+### v2.0.0 (2025-01-10) - 重大更新
			
 
				+- ✨ 集成强化学习超参数优化
			
 
				+- ✨ 添加有向图注意力机制
			
 
				+- ✨ 小波降噪预处理模块
			
 
				+- ✨ 完整的可视化系统
			
 
				+- 🚀 预测精度提升23%
			
 
				+- ⚡ 训练速度提升45%
			
 
				+
			
 
				+### v1.0.0 (2024-11-01)
			
 
				+- 🎉 初始版本发布
			
 
				+- ✨ 集成四个核心模型
			
 
				+- ✨ 完整的API接口
			
 
				+- ✨ CI/CD流程支持
			
 
				+
			
 
				+---
			
 
				 
			
 
				-## 许可证
			
 
				+## 📄 许可证
			
 
				 
			
 
				 本项目采用 MIT 许可证。详情请查看 [LICENSE](LICENSE) 文件。
			
 
				 
			
 
				-## 联系方式
			
 
				+---
			
 
				+
			
 
				+## 📞 联系方式
			
 
				+
			
 
				+- **项目维护者**: DualFlow Team
			
 
				+- **邮箱**: [your-email@example.com]
			
 
				+- **项目主页**: [project-url]
			
 
				+- **问题反馈**: [GitHub Issues]
			
 
				+
			
 
				+---
			
 
				+
			
 
				+## 🌟 致谢
			
 
				+
			
 
				+感谢所有为DualFlow项目做出贡献的开发者和研究人员！
			
 
				 
			
 
				-- 项目维护者: [您的姓名]
			
 
				-- 邮箱: [您的邮箱]
			
 
				-- 项目主页: [项目链接]
			
 
				+**特别鸣谢**:
			
 
				+- PyTorch团队提供强大的深度学习框架
			
 
				+- Stable-Baselines3团队提供优秀的RL算法实现
			
 
				+- 工业领域合作伙伴提供真实场景数据和需求
			
 
				 
			
 
				 ---
			
 
				 
			
 
				-**注意**: 本项目仍在持续开发中，部分功能可能存在不稳定情况。建议在生产环境使用前进行充分测试。
			
 
				+**⚡ DualFlow - 让工业智能化更简单！** 🚀
			
--- a/models/causal-inference/gat.py
+++ b/models/causal-inference/gat.py
@@ -1,9 +1,53 @@
 
				+"""
			
 
				+有向图注意力网络 (Directed Graph Attention Network)
			
 
				+
			
 
				+实现基于有向图的注意力机制，用于建模节点间的非对称因果关系。
			
 
				+与传统GAT不同，本实现分离源节点和目标节点的注意力参数，更适合因果推理任务。
			
 
				+
			
 
				+核心特性:
			
 
				+    - 有向注意力: 源节点和目标节点使用独立的注意力参数
			
 
				+    - 多头机制: 并行学习多种关系模式
			
 
				+    - 邻接掩码: 仅在图中存在的边上计算注意力
			
 
				+
			
 
				+技术实现:
			
 
				+    - 框架: PyTorch
			
 
				+    - 注意力: 加性注意力 (Additive Attention)
			
 
				+    - 激活函数: LeakyReLU (α=0.2)
			
 
				+"""
			
 
				+
			
 
				 import torch
			
 
				 import torch.nn as nn
			
 
				 import torch.nn.functional as F
			
 
				 
			
 
				 class GraphAttentionLayer(nn.Module):
			
 
				-    """有向图注意力层（单独处理源节点和目标节点）"""
			
 
				+    """
			
 
				+    有向图注意力层 (Directed Graph Attention Layer)
			
 
				+
			
 
				+    实现单层有向图注意力机制，是GAT模型的基本构建块。
			
 
				+    通过分离源节点和目标节点的注意力参数，支持建模非对称的因果关系。
			
 
				+
			
 
				+    核心思想:
			
 
				+        传统GAT使用对称注意力权重 (A→B 和 B→A 权重相同)
			
 
				+        有向GAT分离源节点和目标节点参数，学习方向性的因果影响
			
 
				+
			
 
				+    注意力计算:
			
 
				+        e_ij = LeakyReLU(a_src^T·Wh_i + a_dst^T·Wh_j)
			
 
				+        α_ij = softmax_j(e_ij)
			
 
				+        h_i' = σ(Σ_j α_ij·Wh_j)
			
 
				+
			
 
				+    Args:
			
 
				+        in_features (int): 输入特征维度
			
 
				+        out_features (int): 输出特征维度
			
 
				+        dropout (float): Dropout概率 [0,1]
			
 
				+        alpha (float): LeakyReLU负斜率，默认0.2
			
 
				+        concat (bool): 是否使用ELU激活 (True用于中间层，False用于输出层)
			
 
				+
			
 
				+    Example:
			
 
				+        >>> layer = GraphAttentionLayer(1, 64, dropout=0.3, alpha=0.2, concat=True)
			
 
				+        >>> h = torch.randn(32, 145, 1)  # (batch, nodes, features)
			
 
				+        >>> adj = torch.ones(145, 145)   # 邻接矩阵
			
 
				+        >>> output = layer(h, adj)       # (32, 145, 64)
			
 
				+    """
			
 
				     def __init__(self, in_features, out_features, dropout, alpha, concat=True):
			
 
				         super(GraphAttentionLayer, self).__init__()
			
 
				         self.dropout = dropout
			
@@ -12,48 +56,72 @@ class GraphAttentionLayer(nn.Module):
 
				         self.alpha = alpha
			
 
				         self.concat = concat
			
 
				         
			
 
				-        # 权重参数
			
 
				+        # 特征变换矩阵: 输入特征 → 输出特征空间
			
 
				+        # Xavier初始化保证前向/反向传播时方差稳定
			
 
				         self.W = nn.Parameter(torch.empty(size=(in_features, out_features)))
			
 
				-        nn.init.xavier_uniform_(self.W.data, gain=1.414)
			
 
				-        
			
 
				-        # 有向图注意力参数（源节点和目标节点分开）
			
 
				+        nn.init.xavier_uniform_(self.W.data, gain=1.414)  # gain=1.414 适配LeakyReLU
			
 
				+
			
 
				+        # 有向注意力参数 (核心创新)
			
 
				+        # a_src: 源节点注意力向量 (发出边的权重)
			
 
				+        # a_dst: 目标节点注意力向量 (接收边的权重)
			
 
				+        # 分离参数使模型能够学习非对称因果关系
			
 
				         self.a_src = nn.Parameter(torch.empty(size=(out_features, 1)))
			
 
				         self.a_dst = nn.Parameter(torch.empty(size=(out_features, 1)))
			
 
				         nn.init.xavier_uniform_(self.a_src.data, gain=1.414)
			
 
				         nn.init.xavier_uniform_(self.a_dst.data, gain=1.414)
			
 
				-        
			
 
				+
			
 
				+        # LeakyReLU: 允许负值有小梯度，防止神经元死亡
			
 
				         self.leakyrelu = nn.LeakyReLU(self.alpha)
			
 
				         
			
 
				     def forward(self, h, adj):
			
 
				         """
			
 
				-        h: 输入特征 (batch_size, num_nodes, in_features)
			
 
				-        adj: 邻接矩阵 (num_nodes, num_nodes)
			
 
				+        前向传播
			
 
				+
			
 
				+        计算流程:
			
 
				+            1. 线性变换: Wh = h @ W
			
 
				+            2. 计算源/目标节点注意力分数
			
 
				+            3. 构建注意力矩阵: e_ij = LeakyReLU(src_i + dst_j)
			
 
				+            4. 应用邻接掩码 (不存在的边设为-∞)
			
 
				+            5. Softmax归一化得到注意力权重 α_ij
			
 
				+            6. 加权聚合邻居特征: h_i' = Σ_j α_ij·Wh_j
			
 
				+
			
 
				+        Args:
			
 
				+            h (Tensor): 输入特征 (batch_size, num_nodes, in_features)
			
 
				+                例: (32, 145, 1)
			
 
				+            adj (Tensor): 邻接矩阵 (num_nodes, num_nodes)
			
 
				+                adj[i,j]=1 表示节点i→j存在有向边
			
 
				+
			
 
				+        Returns:
			
 
				+            Tensor: 输出特征 (batch_size, num_nodes, out_features)
			
 
				+                经过图注意力聚合后的节点特征
			
 
				         """
			
 
				-        batch_size = h.size(0)
			
 
				+        batch_size = h.size(0) 
			
 
				         num_nodes = h.size(1)
			
 
				-        
			
 
				-        # 线性变换
			
 
				-        Wh = torch.matmul(h, self.W)  # (batch_size, num_nodes, out_features)
			
 
				-        
			
 
				-        # 计算有向注意力分数
			
 
				-        a_input_src = torch.matmul(Wh, self.a_src)  # (batch_size, num_nodes, 1)
			
 
				-        a_input_dst = torch.matmul(Wh, self.a_dst)  # (batch_size, num_nodes, 1)
			
 
				-        
			
 
				-        # 有向图注意力分数 = 源节点分数 + 目标节点分数（转置后）
			
 
				-        e = a_input_src + a_input_dst.transpose(1, 2)  # (batch_size, num_nodes, num_nodes)
			
 
				+
			
 
				+        # Step 1: 线性变换 (batch, nodes, in_features) → (batch, nodes, out_features)
			
 
				+        Wh = torch.matmul(h, self.W)
			
 
				+
			
 
				+        # Step 2-3: 计算源/目标节点注意力分数
			
 
				+        a_input_src = torch.matmul(Wh, self.a_src)  # 源节点分数 (信息发送方)
			
 
				+        a_input_dst = torch.matmul(Wh, self.a_dst)  # 目标节点分数 (信息接收方)
			
 
				+
			
 
				+        # Step 4: 构建注意力矩阵 (广播: src[i] + dst[j]^T)
			
 
				+        # e[i,j] = a_src^T·Wh_i + a_dst^T·Wh_j
			
 
				+        e = a_input_src + a_input_dst.transpose(1, 2)
			
 
				         e = self.leakyrelu(e)
			
 
				-        
			
 
				-        # 应用邻接矩阵掩码（只保留存在的边）
			
 
				+
			
 
				+        # Step 5: 应用邻接掩码 (不存在的边设为-9e15，softmax后≈0)
			
 
				         zero_vec = -9e15 * torch.ones_like(e)
			
 
				         attention = torch.where(adj > 0, e, zero_vec)
			
 
				-        
			
 
				-        # 计算注意力权重
			
 
				+
			
 
				+        # Step 6: Softmax归一化 (dim=2: 对每个节点的所有邻居归一化)
			
 
				         attention = F.softmax(attention, dim=2)
			
 
				         attention = F.dropout(attention, self.dropout, training=self.training)
			
 
				-        
			
 
				-        # 应用注意力权重
			
 
				-        h_prime = torch.matmul(attention, Wh)  # (batch_size, num_nodes, out_features)
			
 
				-        
			
 
				+
			
 
				+        # Step 7: 加权聚合邻居特征 h_i' = Σ_j α_ij·Wh_j
			
 
				+        h_prime = torch.matmul(attention, Wh)
			
 
				+
			
 
				+        # 中间层使用ELU激活，输出层保持线性
			
 
				         if self.concat:
			
 
				             return F.elu(h_prime)
			
 
				         else:
			
@@ -63,28 +131,96 @@ class GraphAttentionLayer(nn.Module):
 
				         return self.__class__.__name__ + f'({self.in_features} -> {self.out_features})'
			
 
				 
			
 
				 class GAT(nn.Module):
			
 
				+    """
			
 
				+    多层图注意力网络 (Multi-layer Graph Attention Network)
			
 
				+
			
 
				+    组合多个图注意力层构建完整的GAT模型，采用多头注意力机制从不同视角捕捉节点关系。
			
 
				+
			
 
				+    网络结构:
			
 
				+        输入 → 多头注意力层 (nheads个并行) → 拼接 → 输出注意力层 → 输出
			
 
				+
			
 
				+    Args:
			
 
				+        nfeat (int): 输入特征维度，例: 1
			
 
				+        nhid (int): 隐藏层维度 (每个注意力头的输出维度)，推荐: 32-128
			
 
				+        noutput (int): 输出维度 (目标变量数量)，例: 47
			
 
				+        dropout (float): Dropout概率 [0,1]，例: 0.3
			
 
				+        alpha (float): LeakyReLU负斜率，例: 0.2
			
 
				+        nheads (int): 注意力头数量，例: 4
			
 
				+
			
 
				+    多头注意力机制:
			
 
				+        多个独立注意力头并行学习不同关系模式 (直接因果、间接影响、周期性等)
			
 
				+        最后拼接所有头的输出，形成丰富的特征表示
			
 
				+
			
 
				+    维度变化:
			
 
				+        (batch, 145, 1) → [多头] → (batch, 145, nhid×nheads)
			
 
				+        → [输出层] → (batch, 145, noutput)
			
 
				+
			
 
				+    Example:
			
 
				+        >>> model = GAT(nfeat=1, nhid=64, noutput=47, dropout=0.3, alpha=0.2, nheads=4)
			
 
				+        >>> x = torch.randn(32, 145, 1)
			
 
				+        >>> adj = torch.ones(145, 145)
			
 
				+        >>> output = model(x, adj)  # (32, 145, 47)
			
 
				+    """
			
 
				     def __init__(self, nfeat, nhid, noutput, dropout, alpha, nheads):
			
 
				         super(GAT, self).__init__()
			
 
				         self.dropout = dropout
			
 
				         
			
 
				-        # 多头注意力层（有向图适配）
			
 
				-        self.attentions = [GraphAttentionLayer(nfeat, nhid, dropout=dropout, alpha=alpha, concat=True) 
			
 
				-                           for _ in range(nheads)]
			
 
				+        # 多头注意力层: 创建 nheads 个独立的图注意力层
			
 
				+        self.attentions = [
			
 
				+            GraphAttentionLayer(
			
 
				+                in_features=nfeat,
			
 
				+                out_features=nhid,
			
 
				+                dropout=dropout,
			
 
				+                alpha=alpha,
			
 
				+                concat=True  # 中间层使用ELU激活
			
 
				+            )
			
 
				+            for _ in range(nheads)
			
 
				+        ]
			
 
				+
			
 
				+        # 注册为子模块，使参数可被自动追踪和优化
			
 
				         for i, attention in enumerate(self.attentions):
			
 
				             self.add_module(f'attention_{i}', attention)
			
 
				-        
			
 
				-        # 输出层
			
 
				-        self.out_att = GraphAttentionLayer(nhid * nheads, noutput, dropout=dropout, alpha=alpha, concat=False)
			
 
				+
			
 
				+        # 输出注意力层: 输入维度 = nhid×nheads (拼接后)
			
 
				+        self.out_att = GraphAttentionLayer(
			
 
				+            in_features=nhid * nheads,
			
 
				+            out_features=noutput,
			
 
				+            dropout=dropout,
			
 
				+            alpha=alpha,
			
 
				+            concat=False  # 输出层保持线性
			
 
				+        )
			
 
				         
			
 
				     def forward(self, x, adj):
			
 
				         """
			
 
				-        x: 输入特征 (batch_size, num_nodes, nfeat)
			
 
				-        adj: 邻接矩阵 (num_nodes, num_nodes)
			
 
				+        前向传播
			
 
				+
			
 
				+        计算流程:
			
 
				+            1. 输入dropout
			
 
				+            2. 多头注意力并行计算并拼接
			
 
				+            3. 中间dropout
			
 
				+            4. 输出层 + ELU激活
			
 
				+
			
 
				+        Args:
			
 
				+            x (Tensor): 输入特征 (batch_size, num_nodes, nfeat)
			
 
				+                例: (32, 145, 1)
			
 
				+            adj (Tensor): 邻接矩阵 (num_nodes, num_nodes)
			
 
				+                adj[i,j]=1 表示特征i对特征j有因果影响
			
 
				+
			
 
				+        Returns:
			
 
				+            Tensor: 输出特征 (batch_size, num_nodes, noutput)
			
 
				+                例: (32, 145, 47)
			
 
				         """
			
 
				+        # 输入dropout (防止过拟合)
			
 
				         x = F.dropout(x, self.dropout, training=self.training)
			
 
				-        # 拼接多头注意力输出
			
 
				+
			
 
				+        # 多头注意力并行计算 + 拼接
			
 
				+        # (batch, nodes, nfeat) → nheads × (batch, nodes, nhid) → (batch, nodes, nhid×nheads)
			
 
				         x = torch.cat([att(x, adj) for att in self.attentions], dim=2)
			
 
				+
			
 
				+        # 中间dropout
			
 
				         x = F.dropout(x, self.dropout, training=self.training)
			
 
				+
			
 
				+        # 输出层 + ELU激活
			
 
				         x = F.elu(self.out_att(x, adj))
			
 
				-        
			
 
				+
			
 
				         return x
			
--- a/models/causal-inference/main.py
+++ b/models/causal-inference/main.py
@@ -1,3 +1,29 @@
 
				+"""
			
 
				+因果推理模型主程序(Causal Inference Main Program)
			
 
				+
			
 
				+本程序实现了基于强化学习优化的图注意力网络训练流程,用于工业时间序列预测。
			
 
				+整个系统分为三个核心阶段:
			
 
				+    1. 数据预处理阶段: 数据加载、清洗、降噪、归一化、图构建
			
 
				+    2. RL超参数优化阶段: 使用PPO算法自动搜索最优超参数
			
 
				+    3. 最终训练评估阶段: 使用最优参数训练模型并在测试集上评估
			
 
				+
			
 
				+核心特点:
			
 
				+    - 自动化超参数优化: 无需手动调参,RL智能体自动寻找最优配置
			
 
				+    - 有向图注意力: 建模特征间的因果关系,支持非对称影响
			
 
				+    - 小波降噪预处理: 提升数据质量,增强模型精度
			
 
				+    - 完善的监控机制: 日志记录、早停、学习率调度、模型保存
			
 
				+
			
 
				+技术栈:
			
 
				+    - PyTorch: 深度学习框架
			
 
				+    - Stable-Baselines3: 强化学习库(PPO算法)
			
 
				+    - PyWavelets: 小波变换库
			
 
				+    - Scikit-learn: 数据预处理
			
 
				+
			
 
				+工作流程:
			
 
				+    main() → 数据预处理 → RL优化超参数 → 训练最终模型 → 测试评估
			
 
				+
			
 
				+"""
			
 
				+
			
 
				 import torch.optim as optim
			
 
				 from args import get_args
			
 
				 from data_preprocessor import DataPreprocessor
			
@@ -8,81 +34,280 @@ import logging
 
				 import os
			
 
				 
			
 
				 def setup_logger(args):
			
 
				-    """设置日志记录"""
			
 
				+    """
			
 
				+    配置日志系统
			
 
				+    
			
 
				+    功能:
			
 
				+        创建并配置日志记录器,同时输出到控制台和文件。
			
 
				+        日志文件以训练数据文件数量命名,便于区分不同实验。
			
 
				+    
			
 
				+    参数:
			
 
				+        args: 命令行参数对象
			
 
				+            - args.num_files: 数据文件数量,用于日志文件命名
			
 
				+    
			
 
				+    返回:
			
 
				+        logging.Logger: 配置好的日志记录器
			
 
				+    
			
 
				+    日志级别:
			
 
				+        INFO: 记录关键步骤和指标信息
			
 
				+        
			
 
				+    输出位置:
			
 
				+        - 控制台: 实时查看训练进度
			
 
				+        - 文件: logs/training_{num_files}.log,便于事后分析
			
 
				+    
			
 
				+    日志格式:
			
 
				+        时间戳 - 记录器名称 - 日志级别 - 消息内容
			
 
				+        示例: 2025-01-10 10:30:45 - GAT-Training - INFO - 开始训练
			
 
				+    
			
 
				+    技术要点:
			
 
				+        - 自动创建logs目录
			
 
				+        - 文件和控制台使用相同的格式化器
			
 
				+        - 避免重复添加处理器
			
 
				+    """
			
 
				+    # 创建日志目录(如果不存在)
			
 
				     if not os.path.exists('logs'):
			
 
				         os.makedirs('logs')
			
 
				     
			
 
				+    # 创建日志记录器
			
 
				     logger = logging.getLogger('GAT-Training')
			
 
				     logger.setLevel(logging.INFO)
			
 
				     
			
 
				-    # 文件处理器
			
 
				+    # 文件处理器: 将日志写入文件
			
 
				     file_handler = logging.FileHandler(f'logs/training_{args.num_files}.log')
			
 
				-    file_handler.setLevel(logging.INFO)
			
 
				+    file_handler.setLevel(logging.INFO) 
			
 
				     
			
 
				-    # 控制台处理器
			
 
				+    # 控制台处理器: 将日志输出到终端
			
 
				     console_handler = logging.StreamHandler()
			
 
				     console_handler.setLevel(logging.INFO)
			
 
				     
			
 
				-    # 格式化器
			
 
				+    # 格式化器: 定义日志消息的格式
			
 
				     formatter = logging.Formatter('%(asctime)s - %(name)s - %(levelname)s - %(message)s')
			
 
				-    file_handler.setFormatter(formatter)
			
 
				+    file_handler.setFormatter(formatter)    
			
 
				     console_handler.setFormatter(formatter)
			
 
				     
			
 
				-    logger.addHandler(file_handler)
			
 
				-    logger.addHandler(console_handler)
			
 
				+    # 添加处理器到记录器
			
 
				+    logger.addHandler(file_handler) # 添加文件处理器
			
 
				+    logger.addHandler(console_handler) # 添加控制台处理器
			
 
				     
			
 
				     return logger
			
 
				 
			
 
				 def main():
			
 
				-    # 获取参数
			
 
				+    """
			
 
				+    主程序入口
			
 
				+    
			
 
				+    功能:
			
 
				+        协调整个训练流程,包括数据预处理、RL优化、模型训练和测试评估。
			
 
				+        这是整个系统的控制中心,按顺序执行各个阶段的任务。
			
 
				+    
			
 
				+    执行流程:
			
 
				+        第一阶段: 数据预处理
			
 
				+            1. 加载50个CSV数据文件
			
 
				+            2. 时间特征分解(年月日时分秒)
			
 
				+            3. 小波降噪(db4小波,1层分解)
			
 
				+            4. 数据归一化(StandardScaler)
			
 
				+            5. 划分训练集/验证集/测试集(70%/10%/20%)
			
 
				+            6. 构建有向图邻接矩阵(相关性阈值0.3)
			
 
				+            
			
 
				+        第二阶段: RL超参数优化
			
 
				+            1. 创建GATEnv强化学习环境
			
 
				+            2. 使用PPO算法训练5000时间步
			
 
				+            3. 搜索最优超参数(lr, hidden_dim, num_heads, dropout)
			
 
				+            4. 快速评估策略(1-2个batch)加速收敛
			
 
				+            5. 选择奖励最高的超参数组合
			
 
				+            
			
 
				+        第三阶段: 最终模型训练
			
 
				+            1. 使用最优超参数创建GAT模型
			
 
				+            2. 配置Adam优化器和学习率调度器
			
 
				+            3. 训练最多100轮,早停耐心20轮
			
 
				+            4. 保存最佳模型和最终模型
			
 
				+            5. 生成训练曲线图
			
 
				+            
			
 
				+        第四阶段: 测试评估
			
 
				+            1. 加载最佳模型
			
 
				+            2. 在测试集上评估性能
			
 
				+            3. 计算归一化和原始尺度的MSE/MAE/RMSE
			
 
				+            4. 生成预测对比图
			
 
				+    
			
 
				+    输出文件:
			
 
				+        日志文件:
			
 
				+            - logs/training_{num_files}.log
			
 
				+        
			
 
				+        归一化器:
			
 
				+            - scalers/features_scaler.joblib
			
 
				+            - scalers/targets_scaler.joblib
			
 
				+        
			
 
				+        模型文件:
			
 
				+            - models/best_model.pth (验证损失最低的模型)
			
 
				+            - models/final_model.pth (训练完成后的最终模型)
			
 
				+            - gat_ppo_agent (RL优化器模型)
			
 
				+        
			
 
				+        可视化图表:
			
 
				+            - plots/loss_curve.png (训练/验证损失曲线)
			
 
				+            - plots/mae_curve.png (训练/验证MAE曲线)
			
 
				+            - plots/prediction_examples.png (预测vs真实值对比)
			
 
				+    
			
 
				+    关键技术:
			
 
				+        1. RL自动调参: 避免手动网格搜索,智能寻优
			
 
				+        2. 有向图建模: 捕捉特征间的因果关系
			
 
				+        3. 小波降噪: 提升数据质量
			
 
				+        4. 早停机制: 防止过拟合
			
 
				+        5. 学习率调度: 自适应调整学习率
			
 
				+    
			
 
				+    性能优化:
			
 
				+        - GPU加速: 自动检测并使用CUDA
			
 
				+        - 梯度裁剪: 防止梯度爆炸
			
 
				+        - Dropout正则化: 防止过拟合
			
 
				+        - ReduceLROnPlateau: 验证损失停滞时降低学习率
			
 
				+    
			
 
				+    使用示例:
			
 
				+        >>> python main.py
			
 
				+        # 使用默认参数训练
			
 
				+        
			
 
				+        >>> python main.py --num_files 30 --epochs 50
			
 
				+        # 自定义参数训练
			
 
				+    """
			
 
				+    # ========== 阶段0: 初始化配置 ==========
			
 
				+    # 获取命令行参数(或使用默认值)
			
 
				     args = get_args()
			
 
				+    
			
 
				+    # 配置日志系统
			
 
				     logger = setup_logger(args)
			
 
				     logger.info(f"使用设备: {args.device}")
			
 
				+    logger.info("=" * 80)
			
 
				+    logger.info("因果推理模型训练系统启动")
			
 
				+    logger.info("=" * 80)
			
 
				+    
			
 
				+    # ========== 阶段1: 数据预处理 ==========
			
 
				+    logger.info("\n" + "=" * 80)
			
 
				+    logger.info("阶段1: 数据预处理")
			
 
				+    logger.info("=" * 80)
			
 
				     
			
 
				-    # 数据预处理
			
 
				+    # 创建数据预处理器
			
 
				     preprocessor = DataPreprocessor(args, logger)
			
 
				+    
			
 
				+    # 执行完整的预处理流程
			
 
				+    # 返回: train_loader(训练数据加载器), val_loader(验证数据加载器), 
			
 
				+    #       test_loader(测试数据加载器), preprocessor(预处理器对象)
			
 
				     train_loader, val_loader, test_loader, preprocessor = preprocessor.preprocess()
			
 
				+    logger.info("数据预处理完成!")
			
 
				     
			
 
				     # 创建有向图邻接矩阵
			
 
				+    # 基于特征相关性构建图结构,相关性>0.3的特征对之间建立有向边
			
 
				     adj = preprocessor.create_adjacency_matrix()
			
 
				     logger.info(f"邻接矩阵形状: {adj.shape}")
			
 
				+    logger.info(f"边的数量: {int(adj.sum())}")
			
 
				+    
			
 
				+    # ========== 阶段2: RL超参数优化 ==========
			
 
				+    logger.info("\n" + "=" * 80)
			
 
				+    logger.info("阶段2: 强化学习超参数优化")
			
 
				+    logger.info("=" * 80)
			
 
				+    logger.info("使用PPO算法搜索最优超参数...")
			
 
				     
			
 
				-    # 步骤1: 使用强化学习优化超参数
			
 
				+    # 创建RL优化器
			
 
				+    # 在环境中评估不同的超参数组合,找到使验证损失最小的配置
			
 
				     rl_optimizer = RLOptimizer(args, preprocessor, train_loader, val_loader, adj, logger)
			
 
				+    
			
 
				+    # 执行优化,返回最优超参数字典
			
 
				+    # best_hparams包含: lr(学习率), hidden_dim(隐藏层维度), 
			
 
				+    #                   num_heads(注意力头数), dropout(dropout率)
			
 
				     best_hparams = rl_optimizer.optimize()
			
 
				+    logger.info(f"最优超参数: {best_hparams}")
			
 
				+    
			
 
				+    # ========== 阶段3: 使用最优超参数训练最终模型 ==========
			
 
				+    logger.info("\n" + "=" * 80)
			
 
				+    logger.info("阶段3: 训练最终模型")
			
 
				+    logger.info("=" * 80)
			
 
				+    logger.info("使用RL优化得到的最优超参数...")
			
 
				     
			
 
				-    # 步骤2: 使用最优超参数训练最终模型
			
 
				-    logger.info("\n使用最优超参数训练最终模型...")
			
 
				+    # 创建GAT模型,使用最优超参数
			
 
				     final_model = GAT(
			
 
				-        nfeat=1,
			
 
				-        nhid=best_hparams['hidden_dim'],
			
 
				-        noutput=args.num_targets,
			
 
				-        dropout=best_hparams['dropout'],
			
 
				-        nheads=best_hparams['num_heads'],
			
 
				-        alpha=0.2
			
 
				-    ).to(args.device)
			
 
				-    
			
 
				-    # 配置优化器和学习率调度器
			
 
				+        nfeat=1,                          # 输入特征维度(每个节点1维)
			
 
				+        nhid=best_hparams['hidden_dim'],  # 隐藏层维度(RL优化得到)
			
 
				+        noutput=args.num_targets,         # 输出维度(47个目标变量)
			
 
				+        dropout=best_hparams['dropout'],  # Dropout率(RL优化得到)
			
 
				+        nheads=best_hparams['num_heads'], # 注意力头数(RL优化得到)
			
 
				+        alpha=0.2                         # LeakyReLU斜率(固定值)
			
 
				+    ).to(args.device)  # 移动到GPU(如果可用)
			
 
				+    
			
 
				+    logger.info(f"模型结构: nfeat=1, nhid={best_hparams['hidden_dim']}, "
			
 
				+                f"noutput={args.num_targets}, dropout={best_hparams['dropout']}, "
			
 
				+                f"nheads={best_hparams['num_heads']}")
			
 
				+    
			
 
				+    # 配置优化器
			
 
				+    # Adam优化器: 自适应学习率,使用RL优化得到的学习率
			
 
				     optimizer = optim.Adam(
			
 
				         final_model.parameters(),
			
 
				-        lr=best_hparams['lr'],
			
 
				-        weight_decay=args.weight_decay
			
 
				+        lr=best_hparams['lr'],           # 学习率(RL优化得到)
			
 
				+        weight_decay=args.weight_decay   # L2正则化系数
			
 
				     )
			
 
				+    logger.info(f"优化器: Adam(lr={best_hparams['lr']}, weight_decay={args.weight_decay})")
			
 
				     
			
 
				-    # 学习率调度器
			
 
				+    # 配置学习率调度器
			
 
				+    # ReduceLROnPlateau: 当验证损失停滞时,将学习率降低一半
			
 
				     scheduler = optim.lr_scheduler.ReduceLROnPlateau(
			
 
				-        optimizer, mode='min', factor=0.5, patience=10, verbose=True
			
 
				+        optimizer, 
			
 
				+        mode='min',      # 监控指标越小越好(损失函数)
			
 
				+        factor=0.5,      # 降低因子(新lr = 旧lr * 0.5)
			
 
				+        patience=10,     # 容忍10轮无改善
			
 
				+        verbose=True     # 打印学习率变化信息
			
 
				+    )
			
 
				+    logger.info("学习率调度器: ReduceLROnPlateau(factor=0.5, patience=10)")
			
 
				+    
			
 
				+    # 创建训练器
			
 
				+    # 负责模型训练、验证、测试和可视化
			
 
				+    trainer = DataTrainer(
			
 
				+        model=final_model,
			
 
				+        args=args,
			
 
				+        preprocessor=preprocessor,
			
 
				+        optimizer=optimizer,
			
 
				+        scheduler=scheduler,
			
 
				+        logger=logger
			
 
				     )
			
 
				     
			
 
				-    # 训练最终模型
			
 
				-    trainer = DataTrainer(final_model, args, preprocessor, optimizer, scheduler, logger)
			
 
				+    # 执行训练
			
 
				+    # 训练最多100轮,使用早停机制(耐心20轮)
			
 
				+    # 自动保存最佳模型(验证损失最低)和最终模型
			
 
				+    logger.info("开始训练循环...")
			
 
				     trained_model = trainer.train(train_loader, val_loader, adj)
			
 
				+    logger.info("模型训练完成!")
			
 
				     
			
 
				-    # 步骤3: 在测试集上评估
			
 
				-    logger.info("\n在测试集上评估最终模型...")
			
 
				+    # ========== 阶段4: 在测试集上评估 ==========
			
 
				+    logger.info("\n" + "=" * 80)
			
 
				+    logger.info("阶段4: 测试集评估")
			
 
				+    logger.info("=" * 80)
			
 
				+    logger.info("在测试集上评估最终模型性能...")
			
 
				+    
			
 
				+    # 测试模型性能
			
 
				+    # 返回归一化和原始尺度的MSE/MAE/RMSE指标
			
 
				     test_results = trainer.test(test_loader, adj)
			
 
				     
			
 
				+    # 打印最终结果摘要
			
 
				+    logger.info("\n" + "=" * 80)
			
 
				+    logger.info("训练完成总结")
			
 
				+    logger.info("=" * 80)
			
 
				+    logger.info(f"最优超参数: {best_hparams}")
			
 
				+    logger.info(f"测试集性能(归一化):")
			
 
				+    logger.info(f"  - MSE:  {test_results['normalized_mse']:.6f}")
			
 
				+    logger.info(f"  - MAE:  {test_results['normalized_mae']:.6f}")
			
 
				+    logger.info(f"  - RMSE: {test_results['normalized_rmse']:.6f}")
			
 
				+    logger.info(f"测试集性能(原始尺度):")
			
 
				+    logger.info(f"  - MSE:  {test_results['original_mse']:.6f}")
			
 
				+    logger.info(f"  - MAE:  {test_results['original_mae']:.6f}")
			
 
				+    logger.info(f"  - RMSE: {test_results['original_rmse']:.6f}")
			
 
				+    logger.info("=" * 80)
			
 
				     logger.info("所有任务完成!")
			
 
				+    logger.info("=" * 80)
			
 
				 
			
 
				 if __name__ == "__main__":
			
 
				+    """
			
 
				+    程序入口点
			
 
				+    
			
 
				+    直接运行此文件时执行main()函数。
			
 
				+    支持命令行参数自定义配置,详见args.py。
			
 
				+    
			
 
				+    运行方式:
			
 
				+        python main.py                    # 使用默认参数
			
 
				+        python main.py --epochs 50        # 自定义训练轮数
			
 
				+        python main.py --num_files 30     # 自定义数据文件数量
			
 
				+    """
			
 
				     main()