生成质量投诉模拟数据 # 角色与目标 你是数据分析助手。请根据本地 Excel 表头,生成 1000 条「贝朗(B. Braun)产品质量投诉」模拟数据(仅用于内部分析、培训或演示,非真实投诉记录),并导出为新的 Excel 文件。 # 1. 输入文件(必须先读) 路径:`贝朗数据/质量投诉数据-表头.xlsx`(若工作区根目录不同,以用户提供的「贝朗数据」文件夹为准)。 | 列 | 字段名 | |----|--------| | A | C3编号 | | B | 型号 | | C | 批号 | | D | 序列号 | | E | 生产企业名称 | | F | 注册证号 | | G | 产品名称 | | H | 医院名称 | | I | 投诉联系人 | | J | 联系人电话 | | K | 故障类型 | | L | 投诉详情(中文) | | M | 上报人 | | N | BU | | O | C3登记日期 | | P | C3登记月 | | Q | 是否不良事件 | | R | 不良事件(否) | | S | 上报坏品数量 | | T | 坏品退回QA数量 | | U | A退回原厂数量 | | V | 调查报告完成日期 | | W | 调查报告(处理意见) | | X | 调查报告中文(处理意见) | | Y | 调查结论(处理结果) | | Z | 赔付结论 | | AA | 关闭日期 | | AB | 投诉状态 | | AC | 有样品返回 | | AD | 事业部 | | AE | 例数 | 工作表名:`complaint form`(与源文件一致)。 # 2. 各列填充规则(A–AE) 以下规则适用于第 2–1001 行数据行;第 1 行为表头,不得改动列名与列顺序。 ## A 列 `C3编号` - 1000 条记录必须唯一。 - 格式建议:`C3-YYYY-6位序号`(如 `C3-2026-000001`)。 - 若源系统存在固定前缀规则,优先匹配该风格。 ## B 列 `型号` - 与 G 列 `产品名称`严格匹配,采用医疗器械常见型号表达(含规格代码、尺寸、Gauge 等)。 - 同一产品名称应对应多个型号,避免全表单一型号。 ## C 列 `批号` - 字母数字组合(如 `A7429158`),长度风格统一。 - 允许低比例重复(同批次多例投诉),但不可大面积重复。 ## D 列 `序列号` - 对于有唯一序列号管理的设备/器械填写唯一值;耗材类可用空值或 `N/A`(需统一口径)。 - 若填写,建议格式:`SN` + 8~12 位字符。 ## E 列 `生产企业名称` - 使用贝朗相关主体或生产方命名风格(如贝朗医疗相关公司名)。 - 与产品线存在常识性匹配,避免明显冲突。 ## F 列 `注册证号` - 使用与 NMPA 注册证号风格一致的格式(可虚构,但格式合理)。 - 可出现历史证号/曾用证号场景,但不得宣称与真实公示逐条一致。 ## G 列 `产品名称` - 基于贝朗在中国常见产品线归纳(输液、透析、外科等)并保持可解释性。 - 与 B/K/AD 等列保持逻辑一致。 ## H 列 `医院名称` - 采用中国境内医院全称风格,覆盖多个省市和层级医院。 - 与投诉场景合理匹配,不出现明显虚构乱码名称。 ## I 列 `投诉联系人` - 使用匿名化中文姓名(如“张医生”“李护士长”或“王老师”),避免真实个人敏感信息。 - 可重复但不宜全表高度重复。 ## J 列 `联系人电话` - 使用脱敏规则生成(如 `138****5621`)或模拟号段(11 位手机格式)。 - 禁止真实可识别电话号码。 ## K 列 `故障类型` - 使用有限枚举值,如:`渗漏`、`堵塞`、`断裂`、`连接不牢`、`包装破损`、`标签不清`、`流速异常` 等。 - 与 G/L 语义一致。 ## L 列 `投诉详情(中文)` - 用简洁中文描述现场问题、发现环节、初步影响。 - 必须与 K 列故障类型一致,避免“类型-详情”冲突。 ## M 列 `上报人` - 使用医院端岗位化称谓(如“设备科-赵工”“护理部-陈老师”)或匿名姓名。 - 与 H/I 保持合理关联。 ## N 列 `BU` - 业务单元枚举(如 `IV Therapy BU`、`Renal Care BU`、`Surgical BU`)。 - 与 G/AD 产品事业线一致。 ## O 列 `C3登记日期` - 日期型字段,建议覆盖近 24~36 个月。 - 需早于或等于 V 列、AA 列对应日期(若后两者非空)。 ## P 列 `C3登记月` - 建议格式:`YYYY-MM`,且必须由 O 列日期派生。 - 禁止与 O 列月份不一致。 ## Q 列 `是否不良事件` - 枚举:`是`/`否`。 - 与 R 列联动:若 Q=`是`,R 应为空或 `N/A`;若 Q=`否`,R 必须有原因说明。 ## R 列 `不良事件(否)` - 仅在 Q=`否` 时填写,如:`未造成患者伤害`、`仅质量缺陷,无临床后果`。 - Q=`是` 时应为空值或统一占位。 ## S 列 `上报坏品数量` - 正整数,通常 1~20;特殊批量事件可更高但占比应低。 - 与 AC(是否有样品返回)和 T/U 数量关系一致。 ## T 列 `坏品退回QA数量` - 整数,范围 `0 <= T <= S`。 - 若 AC=`否`,通常 T=0(或极低比例例外并需可解释)。 ## U 列 `A退回原厂数量` - 整数,范围 `0 <= U <= T`。 - 不应大于 T,且与处理流程状态一致。 ## V 列 `调查报告完成日期` - 日期型;通常晚于 O 列。 - 对于 `投诉状态=处理中` 可为空;`已关闭` 应有值。 ## W 列 `调查报告(处理意见)` - 可用简短英文或系统化术语(如 `Replace`, `No defect found`, `Training reinforced`)。 - 与 X 中文意见语义一致。 ## X 列 `调查报告中文(处理意见)` - 中文处理意见,示例:`更换同批次产品并加强到货检验`、`复测未见异常,建议规范操作培训`。 - 与 Y/Z/AB 结论一致。 ## Y 列 `调查结论(处理结果)` - 枚举建议:`产品缺陷成立`、`操作不当`、`运输损伤`、`未复现`、`资料不足`。 - 与故障类型、处理意见、赔付结论相互印证。 ## Z 列 `赔付结论` - 枚举建议:`无赔付`、`换货`、`折让`、`退款`、`其他协商处理`。 - 对应 Y 结果和投诉严重程度,避免明显不合理组合。 ## AA 列 `关闭日期` - 日期型;`已关闭` 状态必须有关闭日期,且 `AA >= V >= O`(当 V 非空)。 - `处理中` 可为空。 ## AB 列 `投诉状态` - 枚举建议:`新建`、`调查中`、`待补充`、`已关闭`。 - 与 V/AA 是否为空保持一致。 ## AC 列 `有样品返回` - 枚举:`是`/`否`。 - 与 T/U/S 数量字段联动(无样品返回时,通常 QA/原厂退回数量为 0)。 ## AD 列 `事业部` - 事业部名称(如 `输液治疗`、`透析`、`外科`)。 - 与 N(BU)和 G(产品名称)一致,不得错配。 ## AE 列 `例数` - 整数,建议多数为 `1`,聚集性投诉可 >1。 - 与 S 列数量逻辑可区分:`例数`是案例数,`上报坏品数量`是坏品件数。 # 3. 真实感与跨列关联(核心,与第 2 节配合) - 产品与组织一致性:`产品名称-型号-事业部-BU` 必须同一业务语境。 - 时间一致性:`登记日期 -> 调查完成日期 -> 关闭日期` 顺序正确。 - 状态一致性:`投诉状态` 与 `调查完成/关闭日期` 及 `处理意见`匹配。 - 数量一致性:满足 `0 <= U <= T <= S`,并与 `有样品返回` 联动。 - 事件一致性:`是否不良事件` 与 `不良事件(否)` 互斥逻辑严格执行。 - 文本一致性:`故障类型`、`投诉详情`、`调查结论`、`赔付结论` 语义闭环,不互相矛盾。 # 4. 输出 新建 Excel 文件,保存到 `贝朗数据` 文件夹下。 建议文件名:`质量投诉数据-模拟1000条-YYYYMMDD.xlsx`(日期为生成当日)。 工作表名仍为 `complaint form`;第 1 行为原表头,第 2–1001 行为数据。 列顺序与列名与源表头文件完全一致,便于后续 Power BI 或透视分析使用。 # 5. 交付时请用文字简要说明 - 产品清单、故障类型、事业部/BU 的生成口径。 - 状态流转与日期逻辑(新建/调查中/已关闭)的规则。 - 数量字段(S/T/U/AE)的约束规则与异常处理口径。 - 明确声明:本文件为合成数据,不代表真实质量投诉或不良事件记录。 --- ## 附:执行自检清单 | 检查项 | 合格标准 | |------|------| | 行数 | 总行数 1001(含表头),数据行 1000。 | | 列结构 | 31 列列名与顺序与 `质量投诉数据-表头.xlsx` 完全一致。 | | 编码唯一性 | A 列 `C3编号` 唯一;医院/产品关键映射稳定。 | | 数量约束 | 全量满足 `0 <= U <= T <= S`。 | | 日期约束 | 已关闭记录满足 `AA >= V >= O`(当 V 非空)。 | | 状态约束 | `已关闭` 记录有关闭日期;`调查中` 可无关闭日期。 | | 事件约束 | Q/R 列互斥逻辑一致,无冲突值。 |