8.5 KiB
8.5 KiB
生成质量投诉模拟数据
角色与目标
你是数据分析助手。请根据本地 Excel 表头,生成 1000 条「贝朗(B. Braun)产品质量投诉」模拟数据(仅用于内部分析、培训或演示,非真实投诉记录),并导出为新的 Excel 文件。
1. 输入文件(必须先读)
路径:贝朗数据/质量投诉数据-表头.xlsx(若工作区根目录不同,以用户提供的「贝朗数据」文件夹为准)。
| 列 | 字段名 |
|---|---|
| A | C3编号 |
| B | 型号 |
| C | 批号 |
| D | 序列号 |
| E | 生产企业名称 |
| F | 注册证号 |
| G | 产品名称 |
| H | 医院名称 |
| I | 投诉联系人 |
| J | 联系人电话 |
| K | 故障类型 |
| L | 投诉详情(中文) |
| M | 上报人 |
| N | BU |
| O | C3登记日期 |
| P | C3登记月 |
| Q | 是否不良事件 |
| R | 不良事件(否) |
| S | 上报坏品数量 |
| T | 坏品退回QA数量 |
| U | A退回原厂数量 |
| V | 调查报告完成日期 |
| W | 调查报告(处理意见) |
| X | 调查报告中文(处理意见) |
| Y | 调查结论(处理结果) |
| Z | 赔付结论 |
| AA | 关闭日期 |
| AB | 投诉状态 |
| AC | 有样品返回 |
| AD | 事业部 |
| AE | 例数 |
工作表名:complaint form(与源文件一致)。
2. 各列填充规则(A–AE)
以下规则适用于第 2–1001 行数据行;第 1 行为表头,不得改动列名与列顺序。
A 列 C3编号
- 1000 条记录必须唯一。
- 格式建议:
C3-YYYY-6位序号(如C3-2026-000001)。 - 若源系统存在固定前缀规则,优先匹配该风格。
B 列 型号
- 与 G 列
产品名称严格匹配,采用医疗器械常见型号表达(含规格代码、尺寸、Gauge 等)。 - 同一产品名称应对应多个型号,避免全表单一型号。
C 列 批号
- 字母数字组合(如
A7429158),长度风格统一。 - 允许低比例重复(同批次多例投诉),但不可大面积重复。
D 列 序列号
- 对于有唯一序列号管理的设备/器械填写唯一值;耗材类可用空值或
N/A(需统一口径)。 - 若填写,建议格式:
SN+ 8~12 位字符。
E 列 生产企业名称
- 使用贝朗相关主体或生产方命名风格(如贝朗医疗相关公司名)。
- 与产品线存在常识性匹配,避免明显冲突。
F 列 注册证号
- 使用与 NMPA 注册证号风格一致的格式(可虚构,但格式合理)。
- 可出现历史证号/曾用证号场景,但不得宣称与真实公示逐条一致。
G 列 产品名称
- 基于贝朗在中国常见产品线归纳(输液、透析、外科等)并保持可解释性。
- 与 B/K/AD 等列保持逻辑一致。
H 列 医院名称
- 采用中国境内医院全称风格,覆盖多个省市和层级医院。
- 与投诉场景合理匹配,不出现明显虚构乱码名称。
I 列 投诉联系人
- 使用匿名化中文姓名(如“张医生”“李护士长”或“王老师”),避免真实个人敏感信息。
- 可重复但不宜全表高度重复。
J 列 联系人电话
- 使用脱敏规则生成(如
138****5621)或模拟号段(11 位手机格式)。 - 禁止真实可识别电话号码。
K 列 故障类型
- 使用有限枚举值,如:
渗漏、堵塞、断裂、连接不牢、包装破损、标签不清、流速异常等。 - 与 G/L 语义一致。
L 列 投诉详情(中文)
- 用简洁中文描述现场问题、发现环节、初步影响。
- 必须与 K 列故障类型一致,避免“类型-详情”冲突。
M 列 上报人
- 使用医院端岗位化称谓(如“设备科-赵工”“护理部-陈老师”)或匿名姓名。
- 与 H/I 保持合理关联。
N 列 BU
- 业务单元枚举(如
IV Therapy BU、Renal Care BU、Surgical BU)。 - 与 G/AD 产品事业线一致。
O 列 C3登记日期
- 日期型字段,建议覆盖近 24~36 个月。
- 需早于或等于 V 列、AA 列对应日期(若后两者非空)。
P 列 C3登记月
- 建议格式:
YYYY-MM,且必须由 O 列日期派生。 - 禁止与 O 列月份不一致。
Q 列 是否不良事件
- 枚举:
是/否。 - 与 R 列联动:若 Q=
是,R 应为空或N/A;若 Q=否,R 必须有原因说明。
R 列 不良事件(否)
- 仅在 Q=
否时填写,如:未造成患者伤害、仅质量缺陷,无临床后果。 - Q=
是时应为空值或统一占位。
S 列 上报坏品数量
- 正整数,通常 1~20;特殊批量事件可更高但占比应低。
- 与 AC(是否有样品返回)和 T/U 数量关系一致。
T 列 坏品退回QA数量
- 整数,范围
0 <= T <= S。 - 若 AC=
否,通常 T=0(或极低比例例外并需可解释)。
U 列 A退回原厂数量
- 整数,范围
0 <= U <= T。 - 不应大于 T,且与处理流程状态一致。
V 列 调查报告完成日期
- 日期型;通常晚于 O 列。
- 对于
投诉状态=处理中可为空;已关闭应有值。
W 列 调查报告(处理意见)
- 可用简短英文或系统化术语(如
Replace,No defect found,Training reinforced)。 - 与 X 中文意见语义一致。
X 列 调查报告中文(处理意见)
- 中文处理意见,示例:
更换同批次产品并加强到货检验、复测未见异常,建议规范操作培训。 - 与 Y/Z/AB 结论一致。
Y 列 调查结论(处理结果)
- 枚举建议:
产品缺陷成立、操作不当、运输损伤、未复现、资料不足。 - 与故障类型、处理意见、赔付结论相互印证。
Z 列 赔付结论
- 枚举建议:
无赔付、换货、折让、退款、其他协商处理。 - 对应 Y 结果和投诉严重程度,避免明显不合理组合。
AA 列 关闭日期
- 日期型;
已关闭状态必须有关闭日期,且AA >= V >= O(当 V 非空)。 处理中可为空。
AB 列 投诉状态
- 枚举建议:
新建、调查中、待补充、已关闭。 - 与 V/AA 是否为空保持一致。
AC 列 有样品返回
- 枚举:
是/否。 - 与 T/U/S 数量字段联动(无样品返回时,通常 QA/原厂退回数量为 0)。
AD 列 事业部
- 事业部名称(如
输液治疗、透析、外科)。 - 与 N(BU)和 G(产品名称)一致,不得错配。
AE 列 例数
- 整数,建议多数为
1,聚集性投诉可 >1。 - 与 S 列数量逻辑可区分:
例数是案例数,上报坏品数量是坏品件数。
3. 真实感与跨列关联(核心,与第 2 节配合)
- 产品与组织一致性:
产品名称-型号-事业部-BU必须同一业务语境。 - 时间一致性:
登记日期 -> 调查完成日期 -> 关闭日期顺序正确。 - 状态一致性:
投诉状态与调查完成/关闭日期及处理意见匹配。 - 数量一致性:满足
0 <= U <= T <= S,并与有样品返回联动。 - 事件一致性:
是否不良事件与不良事件(否)互斥逻辑严格执行。 - 文本一致性:
故障类型、投诉详情、调查结论、赔付结论语义闭环,不互相矛盾。
4. 输出
新建 Excel 文件,保存到 贝朗数据 文件夹下。
建议文件名:质量投诉数据-模拟1000条-YYYYMMDD.xlsx(日期为生成当日)。
工作表名仍为 complaint form;第 1 行为原表头,第 2–1001 行为数据。
列顺序与列名与源表头文件完全一致,便于后续 Power BI 或透视分析使用。
5. 交付时请用文字简要说明
- 产品清单、故障类型、事业部/BU 的生成口径。
- 状态流转与日期逻辑(新建/调查中/已关闭)的规则。
- 数量字段(S/T/U/AE)的约束规则与异常处理口径。
- 明确声明:本文件为合成数据,不代表真实质量投诉或不良事件记录。
附:执行自检清单
| 检查项 | 合格标准 |
|---|---|
| 行数 | 总行数 1001(含表头),数据行 1000。 |
| 列结构 | 31 列列名与顺序与 质量投诉数据-表头.xlsx 完全一致。 |
| 编码唯一性 | A 列 C3编号 唯一;医院/产品关键映射稳定。 |
| 数量约束 | 全量满足 0 <= U <= T <= S。 |
| 日期约束 | 已关闭记录满足 AA >= V >= O(当 V 非空)。 |
| 状态约束 | 已关闭 记录有关闭日期;调查中 可无关闭日期。 |
| 事件约束 | Q/R 列互斥逻辑一致,无冲突值。 |