Data_Analysis/数据准备过程/模拟数据生成-提示词/生成质量投诉模拟数据.md

8.5 KiB
Raw Permalink Blame History

生成质量投诉模拟数据

角色与目标

你是数据分析助手。请根据本地 Excel 表头,生成 1000 条「贝朗B. Braun产品质量投诉」模拟数据仅用于内部分析、培训或演示非真实投诉记录并导出为新的 Excel 文件。

1. 输入文件(必须先读)

路径:贝朗数据/质量投诉数据-表头.xlsx(若工作区根目录不同,以用户提供的「贝朗数据」文件夹为准)。

字段名
A C3编号
B 型号
C 批号
D 序列号
E 生产企业名称
F 注册证号
G 产品名称
H 医院名称
I 投诉联系人
J 联系人电话
K 故障类型
L 投诉详情(中文)
M 上报人
N BU
O C3登记日期
P C3登记月
Q 是否不良事件
R 不良事件(否)
S 上报坏品数量
T 坏品退回QA数量
U A退回原厂数量
V 调查报告完成日期
W 调查报告(处理意见)
X 调查报告中文(处理意见)
Y 调查结论(处理结果)
Z 赔付结论
AA 关闭日期
AB 投诉状态
AC 有样品返回
AD 事业部
AE 例数

工作表名:complaint form(与源文件一致)。

2. 各列填充规则AAE

以下规则适用于第 21001 行数据行;第 1 行为表头,不得改动列名与列顺序。

A 列 C3编号

  • 1000 条记录必须唯一。
  • 格式建议:C3-YYYY-6位序号(如 C3-2026-000001)。
  • 若源系统存在固定前缀规则,优先匹配该风格。

B 列 型号

  • 与 G 列 产品名称严格匹配采用医疗器械常见型号表达含规格代码、尺寸、Gauge 等)。
  • 同一产品名称应对应多个型号,避免全表单一型号。

C 列 批号

  • 字母数字组合(如 A7429158),长度风格统一。
  • 允许低比例重复(同批次多例投诉),但不可大面积重复。

D 列 序列号

  • 对于有唯一序列号管理的设备/器械填写唯一值;耗材类可用空值或 N/A(需统一口径)。
  • 若填写,建议格式:SN + 812 位字符。

E 列 生产企业名称

  • 使用贝朗相关主体或生产方命名风格(如贝朗医疗相关公司名)。
  • 与产品线存在常识性匹配,避免明显冲突。

F 列 注册证号

  • 使用与 NMPA 注册证号风格一致的格式(可虚构,但格式合理)。
  • 可出现历史证号/曾用证号场景,但不得宣称与真实公示逐条一致。

G 列 产品名称

  • 基于贝朗在中国常见产品线归纳(输液、透析、外科等)并保持可解释性。
  • 与 B/K/AD 等列保持逻辑一致。

H 列 医院名称

  • 采用中国境内医院全称风格,覆盖多个省市和层级医院。
  • 与投诉场景合理匹配,不出现明显虚构乱码名称。

I 列 投诉联系人

  • 使用匿名化中文姓名(如“张医生”“李护士长”或“王老师”),避免真实个人敏感信息。
  • 可重复但不宜全表高度重复。

J 列 联系人电话

  • 使用脱敏规则生成(如 138****5621或模拟号段11 位手机格式)。
  • 禁止真实可识别电话号码。

K 列 故障类型

  • 使用有限枚举值,如:渗漏堵塞断裂连接不牢包装破损标签不清流速异常 等。
  • 与 G/L 语义一致。

L 列 投诉详情(中文)

  • 用简洁中文描述现场问题、发现环节、初步影响。
  • 必须与 K 列故障类型一致,避免“类型-详情”冲突。

M 列 上报人

  • 使用医院端岗位化称谓(如“设备科-赵工”“护理部-陈老师”)或匿名姓名。
  • 与 H/I 保持合理关联。

N 列 BU

  • 业务单元枚举(如 IV Therapy BURenal Care BUSurgical BU)。
  • 与 G/AD 产品事业线一致。

O 列 C3登记日期

  • 日期型字段,建议覆盖近 2436 个月。
  • 需早于或等于 V 列、AA 列对应日期(若后两者非空)。

P 列 C3登记月

  • 建议格式:YYYY-MM,且必须由 O 列日期派生。
  • 禁止与 O 列月份不一致。

Q 列 是否不良事件

  • 枚举:/
  • 与 R 列联动:若 Q=R 应为空或 N/A;若 Q=R 必须有原因说明。

R 列 不良事件(否)

  • 仅在 Q= 时填写,如:未造成患者伤害仅质量缺陷,无临床后果
  • Q= 时应为空值或统一占位。

S 列 上报坏品数量

  • 正整数,通常 120特殊批量事件可更高但占比应低。
  • 与 AC是否有样品返回和 T/U 数量关系一致。

T 列 坏品退回QA数量

  • 整数,范围 0 <= T <= S
  • 若 AC=,通常 T=0或极低比例例外并需可解释

U 列 A退回原厂数量

  • 整数,范围 0 <= U <= T
  • 不应大于 T且与处理流程状态一致。

V 列 调查报告完成日期

  • 日期型;通常晚于 O 列。
  • 对于 投诉状态=处理中 可为空;已关闭 应有值。

W 列 调查报告(处理意见)

  • 可用简短英文或系统化术语(如 Replace, No defect found, Training reinforced)。
  • 与 X 中文意见语义一致。

X 列 调查报告中文(处理意见)

  • 中文处理意见,示例:更换同批次产品并加强到货检验复测未见异常,建议规范操作培训
  • 与 Y/Z/AB 结论一致。

Y 列 调查结论(处理结果)

  • 枚举建议:产品缺陷成立操作不当运输损伤未复现资料不足
  • 与故障类型、处理意见、赔付结论相互印证。

Z 列 赔付结论

  • 枚举建议:无赔付换货折让退款其他协商处理
  • 对应 Y 结果和投诉严重程度,避免明显不合理组合。

AA 列 关闭日期

  • 日期型;已关闭 状态必须有关闭日期,且 AA >= V >= O(当 V 非空)。
  • 处理中 可为空。

AB 列 投诉状态

  • 枚举建议:新建调查中待补充已关闭
  • 与 V/AA 是否为空保持一致。

AC 列 有样品返回

  • 枚举:/
  • 与 T/U/S 数量字段联动(无样品返回时,通常 QA/原厂退回数量为 0

AD 列 事业部

  • 事业部名称(如 输液治疗透析外科)。
  • 与 NBU和 G产品名称一致不得错配。

AE 列 例数

  • 整数,建议多数为 1,聚集性投诉可 >1。
  • 与 S 列数量逻辑可区分:例数是案例数,上报坏品数量是坏品件数。

3. 真实感与跨列关联(核心,与第 2 节配合)

  • 产品与组织一致性:产品名称-型号-事业部-BU 必须同一业务语境。
  • 时间一致性:登记日期 -> 调查完成日期 -> 关闭日期 顺序正确。
  • 状态一致性:投诉状态调查完成/关闭日期处理意见匹配。
  • 数量一致性:满足 0 <= U <= T <= S,并与 有样品返回 联动。
  • 事件一致性:是否不良事件不良事件(否) 互斥逻辑严格执行。
  • 文本一致性:故障类型投诉详情调查结论赔付结论 语义闭环,不互相矛盾。

4. 输出

新建 Excel 文件,保存到 贝朗数据 文件夹下。
建议文件名:质量投诉数据-模拟1000条-YYYYMMDD.xlsx(日期为生成当日)。
工作表名仍为 complaint form;第 1 行为原表头,第 21001 行为数据。
列顺序与列名与源表头文件完全一致,便于后续 Power BI 或透视分析使用。

5. 交付时请用文字简要说明

  • 产品清单、故障类型、事业部/BU 的生成口径。
  • 状态流转与日期逻辑(新建/调查中/已关闭)的规则。
  • 数量字段S/T/U/AE的约束规则与异常处理口径。
  • 明确声明:本文件为合成数据,不代表真实质量投诉或不良事件记录。

附:执行自检清单

检查项 合格标准
行数 总行数 1001含表头数据行 1000。
列结构 31 列列名与顺序与 质量投诉数据-表头.xlsx 完全一致。
编码唯一性 A 列 C3编号 唯一;医院/产品关键映射稳定。
数量约束 全量满足 0 <= U <= T <= S
日期约束 已关闭记录满足 AA >= V >= O(当 V 非空)。
状态约束 已关闭 记录有关闭日期;调查中 可无关闭日期。
事件约束 Q/R 列互斥逻辑一致,无冲突值。