Data_Analysis/数据准备过程/模拟数据生成-提示词/生成质量投诉模拟数据.md

243 lines
8.5 KiB
Markdown
Raw Blame History

This file contains ambiguous Unicode characters

This file contains Unicode characters that might be confused with other characters. If you think that this is intentional, you can safely ignore this warning. Use the Escape button to reveal them.

生成质量投诉模拟数据
# 角色与目标
你是数据分析助手。请根据本地 Excel 表头,生成 1000 条「贝朗B. Braun产品质量投诉」模拟数据仅用于内部分析、培训或演示非真实投诉记录并导出为新的 Excel 文件。
# 1. 输入文件(必须先读)
路径:`贝朗数据/质量投诉数据-表头.xlsx`(若工作区根目录不同,以用户提供的「贝朗数据」文件夹为准)。
| 列 | 字段名 |
|----|--------|
| A | C3编号 |
| B | 型号 |
| C | 批号 |
| D | 序列号 |
| E | 生产企业名称 |
| F | 注册证号 |
| G | 产品名称 |
| H | 医院名称 |
| I | 投诉联系人 |
| J | 联系人电话 |
| K | 故障类型 |
| L | 投诉详情(中文) |
| M | 上报人 |
| N | BU |
| O | C3登记日期 |
| P | C3登记月 |
| Q | 是否不良事件 |
| R | 不良事件(否) |
| S | 上报坏品数量 |
| T | 坏品退回QA数量 |
| U | A退回原厂数量 |
| V | 调查报告完成日期 |
| W | 调查报告(处理意见) |
| X | 调查报告中文(处理意见) |
| Y | 调查结论(处理结果) |
| Z | 赔付结论 |
| AA | 关闭日期 |
| AB | 投诉状态 |
| AC | 有样品返回 |
| AD | 事业部 |
| AE | 例数 |
工作表名:`complaint form`(与源文件一致)。
# 2. 各列填充规则AAE
以下规则适用于第 21001 行数据行;第 1 行为表头,不得改动列名与列顺序。
## A 列 `C3编号`
- 1000 条记录必须唯一。
- 格式建议:`C3-YYYY-6位序号`(如 `C3-2026-000001`)。
- 若源系统存在固定前缀规则,优先匹配该风格。
## B 列 `型号`
- 与 G 列 `产品名称`严格匹配采用医疗器械常见型号表达含规格代码、尺寸、Gauge 等)。
- 同一产品名称应对应多个型号,避免全表单一型号。
## C 列 `批号`
- 字母数字组合(如 `A7429158`),长度风格统一。
- 允许低比例重复(同批次多例投诉),但不可大面积重复。
## D 列 `序列号`
- 对于有唯一序列号管理的设备/器械填写唯一值;耗材类可用空值或 `N/A`(需统一口径)。
- 若填写,建议格式:`SN` + 812 位字符。
## E 列 `生产企业名称`
- 使用贝朗相关主体或生产方命名风格(如贝朗医疗相关公司名)。
- 与产品线存在常识性匹配,避免明显冲突。
## F 列 `注册证号`
- 使用与 NMPA 注册证号风格一致的格式(可虚构,但格式合理)。
- 可出现历史证号/曾用证号场景,但不得宣称与真实公示逐条一致。
## G 列 `产品名称`
- 基于贝朗在中国常见产品线归纳(输液、透析、外科等)并保持可解释性。
- 与 B/K/AD 等列保持逻辑一致。
## H 列 `医院名称`
- 采用中国境内医院全称风格,覆盖多个省市和层级医院。
- 与投诉场景合理匹配,不出现明显虚构乱码名称。
## I 列 `投诉联系人`
- 使用匿名化中文姓名(如“张医生”“李护士长”或“王老师”),避免真实个人敏感信息。
- 可重复但不宜全表高度重复。
## J 列 `联系人电话`
- 使用脱敏规则生成(如 `138****5621`或模拟号段11 位手机格式)。
- 禁止真实可识别电话号码。
## K 列 `故障类型`
- 使用有限枚举值,如:`渗漏`、`堵塞`、`断裂`、`连接不牢`、`包装破损`、`标签不清`、`流速异常` 等。
- 与 G/L 语义一致。
## L 列 `投诉详情(中文)`
- 用简洁中文描述现场问题、发现环节、初步影响。
- 必须与 K 列故障类型一致,避免“类型-详情”冲突。
## M 列 `上报人`
- 使用医院端岗位化称谓(如“设备科-赵工”“护理部-陈老师”)或匿名姓名。
- 与 H/I 保持合理关联。
## N 列 `BU`
- 业务单元枚举(如 `IV Therapy BU`、`Renal Care BU`、`Surgical BU`)。
- 与 G/AD 产品事业线一致。
## O 列 `C3登记日期`
- 日期型字段,建议覆盖近 2436 个月。
- 需早于或等于 V 列、AA 列对应日期(若后两者非空)。
## P 列 `C3登记月`
- 建议格式:`YYYY-MM`,且必须由 O 列日期派生。
- 禁止与 O 列月份不一致。
## Q 列 `是否不良事件`
- 枚举:`是`/`否`。
- 与 R 列联动:若 Q=`是`R 应为空或 `N/A`;若 Q=`否`R 必须有原因说明。
## R 列 `不良事件(否)`
- 仅在 Q=`否` 时填写,如:`未造成患者伤害`、`仅质量缺陷,无临床后果`。
- Q=`是` 时应为空值或统一占位。
## S 列 `上报坏品数量`
- 正整数,通常 120特殊批量事件可更高但占比应低。
- 与 AC是否有样品返回和 T/U 数量关系一致。
## T 列 `坏品退回QA数量`
- 整数,范围 `0 <= T <= S`
- 若 AC=`否`,通常 T=0或极低比例例外并需可解释
## U 列 `A退回原厂数量`
- 整数,范围 `0 <= U <= T`
- 不应大于 T且与处理流程状态一致。
## V 列 `调查报告完成日期`
- 日期型;通常晚于 O 列。
- 对于 `投诉状态=处理中` 可为空;`已关闭` 应有值。
## W 列 `调查报告(处理意见)`
- 可用简短英文或系统化术语(如 `Replace`, `No defect found`, `Training reinforced`)。
- 与 X 中文意见语义一致。
## X 列 `调查报告中文(处理意见)`
- 中文处理意见,示例:`更换同批次产品并加强到货检验`、`复测未见异常,建议规范操作培训`。
- 与 Y/Z/AB 结论一致。
## Y 列 `调查结论(处理结果)`
- 枚举建议:`产品缺陷成立`、`操作不当`、`运输损伤`、`未复现`、`资料不足`。
- 与故障类型、处理意见、赔付结论相互印证。
## Z 列 `赔付结论`
- 枚举建议:`无赔付`、`换货`、`折让`、`退款`、`其他协商处理`。
- 对应 Y 结果和投诉严重程度,避免明显不合理组合。
## AA 列 `关闭日期`
- 日期型;`已关闭` 状态必须有关闭日期,且 `AA >= V >= O`(当 V 非空)。
- `处理中` 可为空。
## AB 列 `投诉状态`
- 枚举建议:`新建`、`调查中`、`待补充`、`已关闭`。
- 与 V/AA 是否为空保持一致。
## AC 列 `有样品返回`
- 枚举:`是`/`否`。
- 与 T/U/S 数量字段联动(无样品返回时,通常 QA/原厂退回数量为 0
## AD 列 `事业部`
- 事业部名称(如 `输液治疗`、`透析`、`外科`)。
- 与 NBU和 G产品名称一致不得错配。
## AE 列 `例数`
- 整数,建议多数为 `1`,聚集性投诉可 >1。
- 与 S 列数量逻辑可区分:`例数`是案例数,`上报坏品数量`是坏品件数。
# 3. 真实感与跨列关联(核心,与第 2 节配合)
- 产品与组织一致性:`产品名称-型号-事业部-BU` 必须同一业务语境。
- 时间一致性:`登记日期 -> 调查完成日期 -> 关闭日期` 顺序正确。
- 状态一致性:`投诉状态` 与 `调查完成/关闭日期``处理意见`匹配。
- 数量一致性:满足 `0 <= U <= T <= S`,并与 `有样品返回` 联动。
- 事件一致性:`是否不良事件` 与 `不良事件(否)` 互斥逻辑严格执行。
- 文本一致性:`故障类型`、`投诉详情`、`调查结论`、`赔付结论` 语义闭环,不互相矛盾。
# 4. 输出
新建 Excel 文件,保存到 `贝朗数据` 文件夹下。
建议文件名:`质量投诉数据-模拟1000条-YYYYMMDD.xlsx`(日期为生成当日)。
工作表名仍为 `complaint form`;第 1 行为原表头,第 21001 行为数据。
列顺序与列名与源表头文件完全一致,便于后续 Power BI 或透视分析使用。
# 5. 交付时请用文字简要说明
- 产品清单、故障类型、事业部/BU 的生成口径。
- 状态流转与日期逻辑(新建/调查中/已关闭)的规则。
- 数量字段S/T/U/AE的约束规则与异常处理口径。
- 明确声明:本文件为合成数据,不代表真实质量投诉或不良事件记录。
---
## 附:执行自检清单
| 检查项 | 合格标准 |
|------|------|
| 行数 | 总行数 1001含表头数据行 1000。 |
| 列结构 | 31 列列名与顺序与 `质量投诉数据-表头.xlsx` 完全一致。 |
| 编码唯一性 | A 列 `C3编号` 唯一;医院/产品关键映射稳定。 |
| 数量约束 | 全量满足 `0 <= U <= T <= S`。 |
| 日期约束 | 已关闭记录满足 `AA >= V >= O`(当 V 非空)。 |
| 状态约束 | `已关闭` 记录有关闭日期;`调查中` 可无关闭日期。 |
| 事件约束 | Q/R 列互斥逻辑一致,无冲突值。 |