jiyuhang
/
data_analysis


			
				
					
						
						
							123456789101112131415161718192021
							PROJECT_ID = 92
# 需要修改
BASE_NAME = f'{PROJECT_ID}_all_items_statistics_hour'
INPUT_CSV_FILE = f'../GetItem/{BASE_NAME}.csv'  # 输入的统计文件，记录了各项字段和记录数
TOTAL_LIST_JSON_FILE = f'{BASE_NAME}.json'  # 筛选后需要计算相关性的字段
OUTPUT_JSON_FILE = f'../Analysis/{BASE_NAME}_out.json'  # 输出的计算结果
COLUMN_NAME_2_INDEX = {'名称': 0, '编码': 1, '单位': 2, '精度': 3, '设备号': 4,'是否枚举':5, '记录数': 6, '最小时间': 7, '最大时间': 8}
# 需要修改
DB_SHEET_NAME = 'dc_item_history_data_hour'  # 需要查询的表单名称
# 需要修改
DATA_MIN_RECORDS = 400 # 低于这个数量的字段将不会参与统计
MAX_LAG = 2
CHECK_YEAR_START = 2025
CHECK_YEAR_END = 2025
CHECK_MONTH_START = 6
CHECK_MONTH_END = 9
CHECK_DAY_START = 10
CHECK_DAY_END = 10

P_VALUE_THRESHOLD = 0.05 # 检验t统计的p值阈值
R_THRESHOLD = 0.35 # 检验t统计的p值阈值，0.6以上可以认为相关程度强，0.8以上可以认为极强