wangmingyang
/
reverse_osmosis_model


			
							123456789101112131415161718192021222324252627282930313233343536373839404142434445464748495051525354555657585960616263646566676869707172737475767778798081828384858687888990919293949596979899100101102103104105106107108109110111112113114115116117118119120121122123124125126127128129130131132133134135136137138139140141142143144145146147148149150151152153154155156157158159160161162163164165166167168169170171172173174175176177178179180181182183184185186187188189190191192193194195196197198199200201202203204205206207208209210211212213214215216217218219220221222223224225226227228229230231232233234235236237238239240241242243244245246247248249250251252253254255256257258259260261262263264265266267268269270271272273274275276277278279280281282283284285286287288289290291292293294295296297298299300301302303304305306307308309310311312313314315316317318319320321322323324325326327328329330331332333334335336337338339340341342343344345346347348349350351352353354355356357358359360361362363364365366367368369370371372373374375376377378379380381382383384385386387388389390391392393394395396397398399400401402403404405406407408409410411412413414415416417418419420421422423424425426427428429430431432433434435436437438439440441442443444445446447448449450451452453454455456457458459460461462463464465466467468469470471472473474475476477478479480481482483484485486487488489490491492493494495496497498499500501502503504505506507508509510511512513514515516517518519520521522523524525526527528529530531532533534535536537538539540541542543544545546547548549550551552553554555556557558559560561562563564565566567568569570571572573574575576577578579580581582583584585586587588589590591592593594595596597598599600601602603604605606607608609610611612613614615616617618619620621622623624625626627628629630631632633634635636637638639640641642643644645646647648649650651652653654655656657658659660661662663664665666667668669670671672673674675676677678679680681682683684685686687688689690691692693694695696697698699700701702703704705706707708709710711712713714715716717718719720721722723724725726727728729730731732733734735736737738739740741742743744745746747748749750751752753754755756757758759760761762763764765766767768769770771772773774775776777778779780781782783784785786787788789790791792793794795796797798799800801802803804805806807808809810811812813814815816817818819820821822823824825826827828
							# -*- coding: utf-8 -*-
"""
RO膜污染监控与CIP预测 - 基于预测数据的最优时机分析

核心功能：分析RO膜压差预测数据，计算最优CIP清洗时机

CIP输出模式:
1. 分段输出模式（separate_stages=True，默认）：
   - 分别输出每个段的独立CIP时机
   - 例如：RO1-一段: 2025-10-15 10:00:00, RO1-二段: 2025-10-20 15:00:00
   
2. 合并输出模式（separate_stages=False，保留以备后用）：
   - 使用策略合并输出一个CIP时机
   - 策略1: 最早时机策略 - 一段或二段任一需要CIP时即触发
   - 策略2: 最晚时机策略 - 等待所有段都需要CIP时触发
   - 策略3: 加权平均策略 - 综合两段污染程度，污染严重段权重更大
   - 策略4: 污染严重程度策略 - 基于k值最大的段决策

使用方法:
    main()  # 使用默认参数（分段输出模式）
    main(separate_stages=False, strategy=3)  # 使用合并模式+策略3
    main(start_date='2025-08-26 00:00:00')  # 指定起始时间
    main(unit_filter='RO1')  # 只分析RO1
"""

import pandas as pd
import numpy as np
from sklearn.linear_model import LinearRegression
from fouling_model_0922.predict import Predictor
from get_api_data import get_sensor_data
import warnings
from datetime import datetime, timedelta
from logging_system import CIPAnalysisLogger
import json
import requests
import time
import os

warnings.filterwarnings('ignore', category=FutureWarning)


# 加载配置文件
def load_config():
    """
    加载配置文件
    
    Returns:
        dict: 配置字典，失败时返回None
    """
    config_path = os.path.join(os.path.dirname(__file__), 'config.json')
    try:
        with open(config_path, 'r', encoding='utf-8') as f:
            config = json.load(f)
        print(f"配置文件加载成功: {config_path}")
        return config
    except Exception as e:
        print(f"配置文件加载失败: {e}")
        return None

# 加载配置
config = load_config()

# 设置请求头
headers = {
    "Content-Type": "application/json",
    "JWT-TOKEN": config['api']['jwt_token']
}
# 构建回调URL
callback_url = config['api']['base_url'] + config['api']['callback_endpoint']
history_url = config['api']['API_History_URL']

def update_cip_history_in_config(result_df):
    """
    保存CIP预测结果到配置文件
    
    功能：将预测的CIP时机写入config.json的cip_times字段的predicted_time
    
    Args:
        result_df: DataFrame，包含机组类型和CIP时机两列
        
    Returns:
        bool: 保存成功返回True，失败返回False
        
    注意：
        此函数已废弃，smart_monitor会自动保存predicted_time
        保留此函数仅为兼容性
    """
    global config
    
    if config is None:
        print("配置文件未加载")
        return False
    
    try:
        config_path = os.path.join(os.path.dirname(__file__), 'config.json')
        
        with open(config_path, 'r', encoding='utf-8') as f:
            current_config = json.load(f)
        
        # 遍历结果，写入配置
        updated_units = []
        for _, row in result_df.iterrows():
            if pd.notna(row["CIP时机"]):
                unit_name = row["机组类型"]
                cip_time = row["CIP时机"].strftime('%Y-%m-%d %H:%M:%S')
                
                if unit_name in current_config.get('cip_times', {}):
                    # 新格式：只更新predicted_time
                    if isinstance(current_config['cip_times'][unit_name], dict):
                        current_config['cip_times'][unit_name]['predicted_time'] = cip_time
                    else:
                        # 兼容旧格式：转换为新格式
                        current_config['cip_times'][unit_name] = {
                            'actual_time': current_config['cip_times'][unit_name],
                            'predicted_time': cip_time
                        }
                    updated_units.append(f"{unit_name}: {cip_time}")
        
        if updated_units:
            with open(config_path, 'w', encoding='utf-8') as f:
                json.dump(current_config, f, ensure_ascii=False, indent=2)
            
            print(f"CIP预测时间已保存:")
            for update in updated_units:
                print(f"  {update}")
            
            config = current_config
            return True
        else:
            print("无CIP时间需要保存")
            return False
            
    except Exception as e:
        print(f"保存CIP预测时间失败: {e}")
        return False

def validate_data(data, name="数据"):
    """
    验证时间序列数据格式
    
    检查项：
    1. 数据非空
    2. 索引类型为DatetimeIndex
    
    Args:
        data: pd.Series或pd.DataFrame
        name: 数据名称，用于错误提示
        
    Returns:
        bool: 验证通过返回True
        
    Raises:
        ValueError: 验证失败时抛出
    """
    if data is None or data.empty:
        raise ValueError(f"{name}为空或无效")
    if not isinstance(data.index, pd.DatetimeIndex):
        raise ValueError(f"{name}的索引必须是时间格式")
    return True


class OptimalCIPPredictor:
    """
    CIP最优时机预测器
    
    工作原理：
    1. 使用滑动窗口计算k值（膜污染速率）
    2. 识别k值连续上升趋势
    3. 在满足时间约束前提下，选择k值最大的时间点
    
    参数说明：
    - window_days: 滑动窗口大小（天），用于线性回归计算k值
    - min_continuous_rising: 最小连续上升点数，确保趋势稳定
    - min_delay_days: 最小延迟天数，避免过早建议CIP
    """
    
    def __init__(self, window_days=7, min_continuous_rising=3, min_delay_days=30):
        """
        初始化预测器
        
        Args:
            window_days: 滑动窗口天数（默认7天）
            min_continuous_rising: 最小连续上升点数（默认3点）
            min_delay_days: 最小延迟天数（默认30天）
        """
        self.window_days = window_days
        self.window_hours = window_days * 24  # 转换为小时
        self.min_continuous_rising = min_continuous_rising
        self.min_delay_days = min_delay_days
        print(f"预测器初始化: 窗口={window_days}天, 连续上升>={min_continuous_rising}点, 延迟>={min_delay_days}天")
    
    def calculate_sliding_k_values(self, pressure_series):
        """
        计算滑动窗口k值序列
        
        基于机理模型: ΔP(t) = ΔP₀ + k×t
        通过线性回归计算斜率k，表示膜污染速率
        
        Args:
            pressure_series: pd.Series，压差时间序列，索引为时间
            
        Returns:
            pd.Series: k值序列，前window_hours个值为NaN
        """
        # 初始化k值序列，索引与输入数据保持一致
        k_values = pd.Series(index=pressure_series.index, dtype=float)
        
        # 滑动窗口遍历，从第window_hours个点开始
        for i in range(self.window_hours, len(pressure_series)):
            # 取当前窗口内的数据
            window_data = pressure_series.iloc[i-self.window_hours:i]
            
            # 数据质量检查：窗口内至少80%的数据有效
            if len(window_data) < self.window_hours * 0.8:
                continue
                
            # 构造时间点序列 [0, 1, 2, ..., window_hours-1]
            time_points = np.arange(len(window_data)).reshape(-1, 1)
            
            try:
                # 线性回归拟合：y = a + k*x，取斜率k作为污染速率
                model = LinearRegression()
                model.fit(time_points, window_data.values)
                k = model.coef_[0]
                k_values.iloc[i] = k
            except:
                # 回归失败时跳过该点
                continue
        
        return k_values
    
    def find_continuous_rising_periods(self, k_values):
        """
        识别k值连续上升的时间段
        
        遍历k值序列，找出所有连续上升的区间
        只保留持续时间大于等于min_continuous_rising的区间
        
        Args:
            k_values: pd.Series，k值序列
            
        Returns:
            list: 连续上升时间段列表，格式 [(start_idx, end_idx, duration), ...]
        """
        rising_periods = []
        start_idx = None  # 当前上升段的起始索引
        
        # 遍历k值序列，寻找连续上升段
        for i in range(1, len(k_values)):
            # 跳过缺失值
            if pd.isna(k_values.iloc[i]) or pd.isna(k_values.iloc[i-1]):
                start_idx = None
                continue
                
            # 判断k值是否上升
            if k_values.iloc[i] > k_values.iloc[i-1]:
                # 开始新的上升段
                if start_idx is None:
                    start_idx = i-1
            else:
                # k值不再上升，结束当前上升段
                if start_idx is not None:
                    duration = i - start_idx
                    # 只保留持续时间足够长的上升段
                    if duration >= self.min_continuous_rising:
                        rising_periods.append((start_idx, i-1, duration))
                    start_idx = None
        
        # 处理序列末尾的上升趋势
        if start_idx is not None:
            duration = len(k_values) - start_idx # 持续时间 
            if duration >= self.min_continuous_rising: # 持续时间足够长  
                rising_periods.append((start_idx, len(k_values)-1, duration)) # 添加上升时间段
        
        return rising_periods
    
    def find_optimal_cip_time(self, pressure_series):
        """
        最优CIP时机
        
        核心步骤：
        1. 计算滑动窗口k值（膜污染速率）
        2. 识别k值连续上升的时间段
        3. 应用时间约束（距离起点至少min_delay_days天）
        4. 在有效时间段内选择k值最大的时间点
        
        Args:
            pressure_series: pd.Series，压差时间序列
            
        Returns:
            tuple: (optimal_time, analysis_result)
                - optimal_time: pd.Timestamp，最优CIP时间，失败时返回None
                - analysis_result: dict，分析结果详情
        """
        # 步骤1：计算滑动k值
        k_values = self.calculate_sliding_k_values(pressure_series)
        valid_k_count = k_values.dropna().shape[0]
        
        # 检查：k值数量是否足够
        if valid_k_count < 10:
            return None, {
                "error": "有效k值数量不足",
                "valid_k_count": valid_k_count,
                "required": 10
            }
        
        # 步骤2：识别连续上升时间段
        rising_periods = self.find_continuous_rising_periods(k_values)
        
        if not rising_periods:
            return None, {
                "error": "未发现连续上升趋势",
                "valid_k_count": valid_k_count,
                "min_continuous_rising": self.min_continuous_rising,
                "hint": "k值没有持续上升趋势，可能膜污染较稳定"
            }
        
        # 步骤3：应用时间约束，筛选有效时间段
        min_delay_time = pressure_series.index[0] + timedelta(days=self.min_delay_days)
        valid_periods = []
        
        for start_idx, end_idx, duration in rising_periods:
            period_start_time = pressure_series.index[start_idx]
            period_end_time = pressure_series.index[end_idx]
            
            # 检查时间段是否在约束范围内
            if period_end_time >= min_delay_time:
                if period_start_time < min_delay_time:
                    # 时间段部分在约束范围内，截取有效部分
                    delay_idx = pressure_series.index.get_indexer([min_delay_time], method='nearest')[0]
                    if delay_idx <= end_idx:
                        valid_periods.append((delay_idx, end_idx, end_idx - delay_idx + 1))
                else:
                    # 时间段完全在约束范围内
                    valid_periods.append((start_idx, end_idx, duration))
        
        if not valid_periods:
            return None, {
                "error": f"无满足时间约束的上升趋势(需>={self.min_delay_days}天后)",
                "rising_periods_count": len(rising_periods),
                "min_delay_days": self.min_delay_days,
                "data_days": (pressure_series.index[-1] - pressure_series.index[0]).days,
                "hint": f"发现{len(rising_periods)}个上升趋势，但都在前{self.min_delay_days}天内"
            }
        
        # 步骤4：在有效时间段内寻找k值最大的点
        best_time = None
        best_k = -np.inf
        
        for start_idx, end_idx, duration in valid_periods:
            period_k_values = k_values.iloc[start_idx:end_idx+1]
            max_k_idx = period_k_values.idxmax()  # k值最大点的索引
            max_k_value = period_k_values.max()   # k值最大值
            
            if max_k_value > best_k:
                best_k = max_k_value
                best_time = max_k_idx
        
        # 构建分析结果
        analysis_result = {
            "success": True,
            "delay_days": (best_time - pressure_series.index[0]).days,
            "best_k": float(best_k),
            "valid_periods_count": len(valid_periods)
        }
        
        return best_time, analysis_result

def select_optimal_cip_strategy_1(cip_results):
    """
    策略1：最早时机策略
    
    选择逻辑：取一段和二段中较早需要CIP的时机
    适用场景：保守运维，及时维护
    """
    if not cip_results:
        return None, "无有效CIP时机"
    
    earliest_result = min(cip_results, key=lambda x: x['delay_days'])
    return earliest_result['time'], f"最早时机策略 - {earliest_result['column']} (第{earliest_result['delay_days']}天)"

def select_optimal_cip_strategy_2(cip_results):
    """
    策略2：最晚时机策略
    
    选择逻辑：取一段和二段中较晚需要CIP的时机
    适用场景：最大化运行时间
    """
    if not cip_results:
        return None, "无有效CIP时机"
    
    latest_result = max(cip_results, key=lambda x: x['delay_days'])
    return latest_result['time'], f"最晚时机策略 - {latest_result['column']} (第{latest_result['delay_days']}天)"

def select_optimal_cip_strategy_3(cip_results):
    """
    策略3：加权平均策略（推荐）
    
    选择逻辑：根据k值对各段CIP时机加权，污染严重段权重更大
    适用场景：平衡运行时间和维护需求
    """
    if not cip_results:
        return None, "无有效CIP时机"
    
    if len(cip_results) == 1:
        result = cip_results[0]
        return result['time'], f"单段加权策略 - {result['column']} (第{result['delay_days']}天)"
    
    # 计算加权平均天数
    total_weight = sum(result['k_value'] for result in cip_results)
    weighted_days = sum(result['delay_days'] * result['k_value'] for result in cip_results) / total_weight
    
    # 找最接近加权平均天数的时机
    target_days = int(round(weighted_days))
    closest_result = min(cip_results, key=lambda x: abs(x['delay_days'] - target_days))
    
    return closest_result['time'], f"加权平均策略 - {closest_result['column']} (目标第{target_days}天，实际第{closest_result['delay_days']}天)"

def select_optimal_cip_strategy_4(cip_results):
    """
    策略4：污染严重程度策略
    
    选择逻辑：选择k值最大（污染最严重）的段的CIP时机
    适用场景：基于实际污染状况决策
    """
    if not cip_results:
        return None, "无有效CIP时机"
    
    max_k_result = max(cip_results, key=lambda x: x['k_value'])
    return max_k_result['time'], f"污染严重程度策略 - {max_k_result['column']} (k值={max_k_result['k_value']:.6f}, 第{max_k_result['delay_days']}天)"

def extract_stage_name(column_name):
    """
    从列名中提取段号信息
    
    Args:
        column_name: str，列名，例如'C.M.RO1_DB@DPT_1_pred'或'C.M.RO2_DB@DPT_2_pred'
    
    Returns:
        str: 段号名称，例如'一段'或'二段'
    """
    if 'DPT_1' in column_name:
        return '一段'
    elif 'DPT_2' in column_name:
        return '二段'
    else:
        return '未知段'

def select_optimal_cip_time(cip_results, strategy=1):
    """
    根据指定策略选择最优CIP时机
    
    Args:
        cip_results: list，各段CIP分析结果列表，每个元素包含time、delay_days、k_value等字段
        strategy: int，策略编号，1-4分别对应不同策略
    
    Returns:
        tuple: (optimal_time, description)
            - optimal_time: pd.Timestamp，最优CIP时间
            - description: str，策略描述
    
    Raises:
        ValueError: 当策略编号无效时抛出
    """
    strategy_map = {
        1: select_optimal_cip_strategy_1,  # 最早时机
        2: select_optimal_cip_strategy_2,  # 最晚时机
        3: select_optimal_cip_strategy_3,  # 加权平均（推荐）
        4: select_optimal_cip_strategy_4   # 污染严重程度
    }
    
    if strategy not in strategy_map:
        raise ValueError(f"无效策略编号: {strategy}，支持的策略: 1-4")
    
    return strategy_map[strategy](cip_results)

def analyze_ro_unit_cip_timing(strategy=1, start_date=None, unit_filter=None, separate_stages=True):
    """
    分析RO机组的最优CIP时间
    
    功能：
    1. 获取压差预测数据
    2. 分析各机组各段的CIP时机
    3. 根据策略选择最优CIP时间
    
    Args:
        strategy: int，CIP时机选择策略（1-4）
            1: 最早时机策略
            2: 最晚时机策略  
            3: 加权平均策略（推荐）
            4: 污染严重程度策略
        start_date: str，预测起始时间，格式'YYYY-MM-DD HH:MM:SS'，默认使用当前时间
        unit_filter: str，指定分析的机组，如'RO1'，默认分析所有机组
        separate_stages: bool，是否分段输出一段和二段的独立CIP时机
            True: 分别输出每个段的CIP时机（例如：RO1-一段、RO1-二段）
            False: 使用策略合并输出一个CIP时机（例如：RO1）
    
    Returns:
        pd.DataFrame: 包含机组类型、CIP时机、策略说明的结果表
    """
    # 初始化日志记录器（传入unit_filter用于目录命名）
    logger = CIPAnalysisLogger(unit_filter=unit_filter)
    
    try:
        # 获取预测数据
        try:
            # 获取 前180天的数据
            df = get_sensor_data(start_date, history_url, headers)
            #预测
            all_data = Predictor().predict(df =df)
            if all_data.empty: 
                logger.logger.error("预测数据为空")
                return pd.DataFrame()
        except Exception as e:
            logger.logger.error(f"获取预测数据失败: {e}")
            return pd.DataFrame()
        
        # 将date列设置为索引
        all_data = all_data.set_index('date')
        
        # 获取预测数据的起始时间
        prediction_start_date = all_data.index[0].to_pydatetime()
        print(f"预测起始: {prediction_start_date.strftime('%Y-%m-%d %H:%M:%S')}")

        # 记录输入参数和预测数据
        logger.log_input_parameters(strategy, start_date, prediction_start_date)
        logger.log_prediction_data(all_data)
        
        # 确定要分析的机组
        if unit_filter:
            unit_ids = [int(unit_filter.replace('RO', ''))]
        else:
            unit_ids = [1, 2, 3, 4]
        
        # 获取各机组的预测天数
        from cip.run_this import main as get_unit_days
        unit_days_dict = {}
        for unit_id in unit_ids:
            unit_days_dict[unit_id] = get_unit_days(unit_id, prediction_start_date)
        
        # 记录机组预测天数
        logger.log_unit_days(unit_days_dict)
        
        # 初始化预测器
        predictor = OptimalCIPPredictor(window_days=7, min_continuous_rising=3, min_delay_days=30)
        
        # 存储分析结果
        results = []
        
        # 遍历分析各机组
        for unit_id in unit_ids:
            # 获取该机组的预测天数
            predict_days = unit_days_dict[unit_id]
            print(f"\n[RO{unit_id}] 预测天数: {predict_days}天")
            
            # 记录分析开始
            logger.log_unit_analysis_start(unit_id, predict_days)
            
            # 截取预测天数范围内的数据
            end_time = all_data.index[0] + timedelta(days=predict_days)
            truncated_data = all_data.loc[all_data.index <= end_time]

            # 筛选该机组的压差列
            ro_name = f"RO{unit_id}"
            pressure_columns = [col for col in truncated_data.columns if ro_name in col and 'DPT' in col and 'pred' in col]
            
            if not pressure_columns:
                print(f"[RO{unit_id}] 警告: 未找到压差列")
                continue
            
            # 记录压差数据
            logger.log_unit_pressure_data(unit_id, truncated_data, pressure_columns)
            
            # 收集各段的CIP分析结果
            cip_results = []
            
            for column in pressure_columns:
                pressure_series = truncated_data[column].dropna()
                pressure_series.name = column
                
                # 数据点数检查：至少需要30天数据
                data_days = len(pressure_series) / 24
                print(f"  {column}: 数据点数={len(pressure_series)}, 约{data_days:.1f}天")
                
                if len(pressure_series) < 30 * 24:
                    print(f"    [跳过] 数据不足30天")
                    logger.log_cip_analysis_result(unit_id, column, None, 
                        {"error": f"数据不足: {len(pressure_series)}点 < 720点(30天)"})
                    continue
                
                try:
                    # 寻找最优CIP时机
                    optimal_time, analysis = predictor.find_optimal_cip_time(pressure_series)
                    
                    # 记录分析结果（带详细诊断信息）
                    if optimal_time:
                        print(f"    [成功] 找到CIP时机: {optimal_time.strftime('%Y-%m-%d %H:%M')}")
                    else:
                        print(f"    [失败] 未找到CIP时机: {analysis.get('error', '未知原因')}")
                    
                    logger.log_cip_analysis_result(unit_id, column, optimal_time, analysis)
                    
                    if optimal_time:
                        cip_results.append({
                            'column': column,
                            'time': optimal_time,
                            'delay_days': analysis['delay_days'],
                            'k_value': analysis['best_k']
                        })
                        
                except Exception as e:
                    print(f"    [异常] 分析失败: {str(e)}")
                    logger.log_cip_analysis_result(unit_id, column, None, {"error": str(e)})
            
            # 根据separate_stages参数决定输出方式
            if cip_results:
                if separate_stages:
                    # 方案1：分段输出每个段的独立CIP时机
                    print(f"\n[RO{unit_id}] 分段输出模式：")
                    for cip_result in cip_results:
                        stage_name = extract_stage_name(cip_result['column'])
                        unit_stage_name = f"RO{unit_id}-{stage_name}"
                        stage_desc = f"独立分析 - {cip_result['column']} (k值={cip_result['k_value']:.6f}, 第{cip_result['delay_days']}天)"
                        
                        results.append({
                            '机组类型': unit_stage_name,
                            'CIP时机': cip_result['time'],
                            '策略说明': stage_desc
                        })
                        print(f"  {unit_stage_name}: {cip_result['time'].strftime('%Y-%m-%d %H:%M:%S')}")
                        
                        # 记录日志
                        logger.log_unit_strategy_result(unit_id, cip_result['time'], f"{stage_name} - {stage_desc}")
                else:
                    # 原有逻辑：使用策略合并输出一个CIP时机（保留以备后用）
                    optimal_time, strategy_desc = select_optimal_cip_time(cip_results, strategy)
                    results.append({
                        '机组类型': f"RO{unit_id}",
                        'CIP时机': optimal_time,
                        '策略说明': strategy_desc
                    })
                    print(f"RO{unit_id} CIP时机: {optimal_time.strftime('%Y-%m-%d %H:%M:%S')}")
                    
                    logger.log_unit_strategy_result(unit_id, optimal_time, strategy_desc)
            else:
                # 如果没找到最优CIP时机，使用预测天数的最后时间作为CIP时机
                fallback_time = end_time
                fallback_desc = f"使用预测终点时间 (第{predict_days}天)"
                
                if separate_stages:
                    # 分段模式：为每个段都输出备用时机
                    print(f"\n[RO{unit_id}] 无有效CIP时机，使用备用策略")
                    for stage_num in ['一段', '二段']:
                        results.append({
                            '机组类型': f"RO{unit_id}-{stage_num}",
                            'CIP时机': fallback_time,
                            '策略说明': fallback_desc
                        })
                        print(f"  RO{unit_id}-{stage_num}: {fallback_time.strftime('%Y-%m-%d %H:%M:%S')} (备用策略)")
                else:
                    # 合并模式：输出一个备用时机
                    results.append({
                        '机组类型': f"RO{unit_id}",
                        'CIP时机': fallback_time,
                        '策略说明': fallback_desc
                    })
                    print(f"RO{unit_id} CIP时机: {fallback_time.strftime('%Y-%m-%d %H:%M:%S')} (备用策略)")
                
                logger.log_unit_strategy_result(unit_id, fallback_time, fallback_desc)
    
        # 生成结果DataFrame
        result_df = pd.DataFrame(results)
        
        # 记录最终结果
        logger.log_final_results(result_df)
        
        # 生成分析图表
        logger.create_analysis_plots(all_data, unit_days_dict)
        
        print("\n" + "="*50)
        for _, row in result_df.iterrows():
            if pd.notna(row['CIP时机']):
                print(f"{row['机组类型']}: {row['CIP时机'].strftime('%Y-%m-%d %H:%M:%S')}")
        print("="*50)
        
        return result_df
        
    except Exception as e:
        logger.logger.error(f"分析过程中发生错误: {e}")
        raise
    finally:
        # 确保日志记录器正确关闭
        logger.close()

def main(strategy=3, start_date=None, unit_filter=None, separate_stages=True, send_callback=True):
    """
    主执行函数
    
    功能：执行RO机组CIP时机分析并发送结果到回调接口
    
    Args:
        strategy: int，CIP时机选择策略（1-4），默认3（加权平均策略）
            1: 最早时机策略
            2: 最晚时机策略  
            3: 加权平均策略
            4: 污染严重程度策略
        start_date: str，预测起始时间，格式'YYYY-MM-DD HH:MM:SS'，默认None（使用当前时间）
        unit_filter: str，指定预测的机组，如'RO1'，默认None（预测所有机组）
        separate_stages: bool，是否分段输出一段和二段的独立CIP时机，默认True
            True: 分别输出每个段的CIP时机（例如：RO1-一段、RO1-二段）
            False: 使用策略合并输出一个CIP时机（例如：RO1）
        send_callback: bool，是否发送回调，默认True
            当从 smart_monitor 调用时应设为 False，避免重复发送
    
    Returns:
        pd.DataFrame: 分析结果
    
    示例：
        result_df = main()  # 使用默认参数（分段输出）
        result_df = main(separate_stages=False)  # 使用策略合并
        result_df = main(start_date='2025-07-01 00:00:00')  # 指定时间
        result_df = main(strategy=1, unit_filter='RO1')  # 指定策略和机组
    """
    # 执行分析 
    result_df = analyze_ro_unit_cip_timing(
        strategy=strategy, 
        start_date=start_date, 
        unit_filter=unit_filter,
        separate_stages=separate_stages
    )
    
    # 发送回调（如果启用）
    if send_callback and config and not result_df.empty:
        callback_success = send_decision_to_callback(result_df)
        if not callback_success:
            print(" 回调发送失败")

    return result_df

def send_decision_to_callback(decision_data):
    """
    将CIP决策结果发送到回调接口
    
    功能：将分析结果按照API格式封装，通过HTTP POST发送到回调地址
    
    Args:
        decision_data: pd.DataFrame，决策数据，包含机组类型和CIP时机
    
    Returns:
        bool: 发送成功返回True，失败返回False
    """
    if config is None:
        print("配置文件未加载")
        return False
    
    try:
        # 获取项目ID
        project_id = config['scada']['project_id']
        
        # 构造回调数据
        callback_list = []
        if isinstance(decision_data, pd.DataFrame):
            for _, row in decision_data.iterrows():
                if pd.notna(row["CIP时机"]):
                    # 从机组类型中提取段号信息
                    unit_type = row["机组类型"]
                    
                    # 判断是一段还是二段
                    if "一段" in unit_type:
                        stage_num = 1
                    elif "二段" in unit_type:
                        stage_num = 2
                    else:
                        stage_num = 1  # 默认为1段（兼容旧格式）
                    
                    # 提取纯粹的机组编号（去掉"-一段"或"-二段"）
                    # 例如："RO1-一段" -> "RO1"，"RO2-二段" -> "RO2"
                    unit_name = unit_type.split('-')[0] if '-' in unit_type else unit_type
                    
                    callback_list.append({
                        "type": unit_name,
                        "project_id": project_id,
                        "ctime": row["CIP时机"].strftime("%Y-%m-%d %H:%M:%S"),
                        "ceb_backwash_frequency": stage_num
                    })
        else:
            callback_list = [decision_data]
        
        # 关键检查：如果没有有效数据，不发送回调
        if not callback_list:
            return False
        
        # 封装为API要求的格式
        payload = {
            "list": callback_list
        }
        # 发送HTTP请求（带重试机制）
        max_retries = 3
        retry_interval = 10
        
        for attempt in range(1, max_retries + 1):
            try:
                response = requests.post(callback_url, headers=headers, json=payload, timeout=15)
                response.raise_for_status()
                print(f"回调发送成功")
                return True
                
            except requests.exceptions.RequestException as e:
                if attempt < max_retries:
                    time.sleep(retry_interval)
                else:
                    print(f"回调发送失败: {e}")
        
        return False
        
    except Exception as e:
        print(f"构建回调数据时出错: {e}")
        return False

if __name__ == '__main__':
    # 示例调用
    
    # 方式1：分段输出模式（默认，推荐）
    # 分别输出RO1-一段、RO1-二段的CIP时机
    main(start_date='2025-10-26 00:00:00', unit_filter='RO1')
    
    # 方式2：合并输出模式（使用策略合并，保留以备后用）
    # main(start_date='2025-08-26 00:00:00', unit_filter='RO1', separate_stages=False, strategy=3)