config_analysis.py 1.0 KB

123456789101112131415161718192021
  1. PROJECT_ID = 92
  2. # 需要修改
  3. BASE_NAME = f'{PROJECT_ID}_all_items_statistics_hour'
  4. INPUT_CSV_FILE = f'../GetItem/{BASE_NAME}.csv' # 输入的统计文件,记录了各项字段和记录数
  5. TOTAL_LIST_JSON_FILE = f'{BASE_NAME}.json' # 筛选后需要计算相关性的字段
  6. OUTPUT_JSON_FILE = f'../Analysis/{BASE_NAME}_out.json' # 输出的计算结果
  7. COLUMN_NAME_2_INDEX = {'名称': 0, '编码': 1, '单位': 2, '精度': 3, '设备号': 4,'是否枚举':5, '记录数': 6, '最小时间': 7, '最大时间': 8}
  8. # 需要修改
  9. DB_SHEET_NAME = 'dc_item_history_data_hour' # 需要查询的表单名称
  10. # 需要修改
  11. DATA_MIN_RECORDS = 400 # 低于这个数量的字段将不会参与统计
  12. MAX_LAG = 2
  13. CHECK_YEAR_START = 2025
  14. CHECK_YEAR_END = 2025
  15. CHECK_MONTH_START = 6
  16. CHECK_MONTH_END = 9
  17. CHECK_DAY_START = 10
  18. CHECK_DAY_END = 10
  19. P_VALUE_THRESHOLD = 0.05 # 检验t统计的p值阈值
  20. R_THRESHOLD = 0.35 # 检验t统计的p值阈值,0.6以上可以认为相关程度强,0.8以上可以认为极强