8.3 KiB
8.3 KiB
生成药品不良事件&投诉模拟数据
角色与目标
你是数据分析助手。请根据本地 Excel 表头,生成 1000 条「药品不良事件与投诉」模拟数据(仅用于内部分析、培训或演示,非真实药物警戒上报数据),并导出为新的 Excel 文件。
1. 输入文件(必须先读)
路径:贝朗数据/药品不良事件&投诉数据-表头.xlsx(若工作区根目录不同,以用户提供的「贝朗数据」文件夹为准)。
工作表名:Tabelle1(与源文件一致)。
表头共 70 列,必须严格保持列名与顺序不变(第 1 行原样保留):
| 序号 | 字段名 |
|---|---|
| 1 | Case owner |
| 2 | reporter |
| 3 | Inbound Channel |
| 4 | Local PV ReceiptDate(含原表头换行说明) |
| 5 | Initial data entry date |
| 6 | Reportability to HA |
| 7 | Due Date to ADR Center |
| 8 | AER# |
| 9 | CC# |
| 10 | Submit date |
| 11 | 反馈码 |
| 12 | 首次/跟踪报告 |
| 13 | 预期/非预期 |
| 14 | 报告类型 |
| 15 | 严重不良反应 |
| 16 | 报告单位类别 |
| 17 | 性别 |
| 18 | 出生日期 |
| 19 | 年龄 |
| 20 | 年龄单位 |
| 21 | 民族 |
| 22 | 体重 |
| 23 | 既往药品不良反应 |
| 24 | 家族药品不良反应 |
| 25 | 不良反应发生时间 |
| 26 | 不良反应过程描述 |
| 27 | 不良反应结果 |
| 28 | 后遗症表现 |
| 29 | 死亡时间 |
| 30 | 直接死因 |
| 31 | 停药减药后反应是否减轻或消失 |
| 32 | 再次使用可疑药是否出现同样反应 |
| 33 | 对原患疾病影响 |
| 34 | 报告人评价 |
| 35 | 报告单位评价 |
| 36 | 报告日期 |
| 37 | 信息来源 |
| 38 | 备注 |
| 39 | 原患疾病名称 |
| 40 | 家族药品不良反应[不良反应名称] |
| 41 | 家族药品不良反应[商品名称] |
| 42 | 家族药品不良反应[严重程度] |
| 43 | 既往药品不良反应[不良反应名称] |
| 44 | 既往药品不良反应[严重程度] |
| 45 | 既往药品不良反应[商品名称] |
| 46 | 相关重要信息 |
| 47 | 相关重要信息(其他) |
| 48 | 怀疑/合并 |
| 49 | 序号 |
| 50 | 批准文号 |
| 51 | 通用名称 |
| 52 | 商品名称 |
| 53 | 剂型 |
| 54 | 生产厂家 |
| 55 | 生产批号 |
| 56 | 用量 |
| 57 | 用量单位 |
| 58 | 用药-次数 |
| 59 | 用药-日数 |
| 60 | 给药途径 |
| 61 | 用药开始时间 |
| 62 | 用药结束时间 |
| 63 | 用药原因 |
| 64 | 不良反应名称 |
| 65 | 严重程度 |
| 66 | 不良反应名称(PT) |
| 67 | 不良反应名称(SOC) |
| 68 | 省 |
| 69 | 市 |
| 70 | 区 |
2. 各列填充规则(1–70)
以下规则适用于第 2–1001 行;第 1 行为原表头,不得改动。
A. 病例流转与时效字段(1–11)
Case owner、reporter:使用岗位化姓名(匿名化),格式统一,避免真实个人敏感信息。Inbound Channel:枚举值(如电话、邮件、销售反馈、医疗机构上报、监管转入)。- 日期逻辑必须满足:
Local PV ReceiptDate <= Initial data entry date <= Submit date。
若Reportability to HA=是,则Due Date to ADR Center必填,且应晚于ReceiptDate。 AER#、CC#:各自唯一编码,建议格式如AER-YYYY-000001、CC-YYYY-000001。反馈码:有限枚举(如有效、无效、待补充)。
B. 报告属性与患者基本信息(12–24)
首次/跟踪报告:枚举首次、跟踪,若为跟踪,AER#应复用同案例主编号规则。预期/非预期、报告类型、严重不良反应、报告单位类别使用固定枚举,避免自由文本混乱。- 患者信息联动:
出生日期、年龄、年龄单位必须可互相解释(允许有轻微误差);体重为数值型并在合理区间。 既往药品不良反应、家族药品不良反应与其展开字段(40–45)保持一致:若主字段为“无”,对应展开字段应空或N/A。
C. 反应发生与医学结局(25–38)
不良反应发生时间应晚于或等于用药开始时间(若有)。不良反应过程描述为中文临床叙述,简洁、可读、与药品信息一致。不良反应结果、后遗症表现、死亡时间、直接死因联动:- 非死亡病例:
死亡时间/直接死因应为空; - 死亡病例:
严重程度应为重度相关,且死因可解释。
- 非死亡病例:
停药减药后反应是否减轻或消失、再次使用可疑药是否出现同样反应使用标准枚举(是/否/不详/未再用)。报告人评价与报告单位评价给出一致但不完全重复的专业结论文本。报告日期通常晚于不良反应发生时间。信息来源、备注可补充场景,但不得出现真实可识别隐私信息。
D. 既往/家族史扩展与重要信息(39–47)
原患疾病名称使用规范疾病名(示例:高血压、糖尿病、慢性肾病等)。- 家族史与既往史展开字段(40–45)建议结构化填写:
- 不良反应名称
- 涉及商品名称
- 严重程度
相关重要信息可枚举(如肝功能异常、肾功能异常、妊娠、过敏体质、其他);
若为其他,相关重要信息(其他)必须填写。
E. 用药信息子表(48–63)
怀疑/合并:枚举怀疑药品、合并用药,至少有一条怀疑药品记录。序号:同一病例内递增序号(若每行仅1药,可统一为 1)。批准文号、通用名称、商品名称、剂型、生产厂家、生产批号需互相匹配且风格真实;文号可模拟但格式需合理。用量为数值,用量单位(mg/ml/片等)与剂型匹配。用药-次数、用药-日数与用药开始/结束时间可互相解释(结束时间应不早于开始时间)。给药途径(口服/静脉滴注/皮下/肌注等)需与药品剂型和反应场景匹配。用药原因与原患疾病名称存在医学关联。
F. 不良反应标准术语与地区字段(64–70)
不良反应名称使用中文医学术语;不良反应名称(PT)、(SOC)与其对应(可参考 MedDRA 术语风格)。严重程度与上文严重不良反应一致,不得矛盾。省/市/区三级行政区必须逻辑一致,不跨省错配;可与报告单位地理分布相匹配。
3. 真实感与跨列关联(核心)
- 时间链路闭环:获知日期、录入日期、上报日期、发生日期、用药起止日期必须前后合理。
- 医学逻辑闭环:可疑药品 -> 用药信息 -> 不良反应名称/PT/SOC -> 严重程度 -> 结局描述应一致。
- 结构化字段闭环:主字段与展开字段(既往史、家族史、重要信息)不冲突。
- 编码唯一性:
AER#和CC#全表唯一;若设计跟踪报告,应保持主案例可追踪。 - 文本去模板化:过程描述和评价需同类可变体,不得 1000 条高度重复同一句。
4. 输出
新建 Excel 文件,保存到 贝朗数据 文件夹下。
建议文件名:药品不良事件&投诉数据-模拟1000条-YYYYMMDD.xlsx(日期为生成当日)。
工作表名仍为 Tabelle1;第 1 行为原表头,第 2–1001 行为数据。
列顺序与列名与源表头文件完全一致(包括原始表头中的换行字符)。
5. 交付时请用文字简要说明
- 病例来源渠道、报告类型、严重程度的大致分布口径。
- 用药信息与反应术语(PT/SOC)的映射口径与来源说明(如为归纳模拟需明确说明)。
- 日期与状态字段的约束规则(尤其上报时限字段)。
- 明确声明:本文件为合成数据,不代表真实药物警戒病例或监管上报记录。
附:执行自检清单
| 检查项 | 合格标准 |
|---|---|
| 行数 | 总行数 1001(含表头),数据行 1000。 |
| 列结构 | 70 列列名与顺序与 药品不良事件&投诉数据-表头.xlsx 完全一致。 |
| 编码规则 | AER#、CC# 唯一;跟踪报告可追踪。 |
| 时间逻辑 | 关键日期前后关系正确,无明显逆序。 |
| 术语一致 | 反应中文名、PT、SOC、严重程度互相匹配。 |
| 字段联动 | 主字段与展开字段(既往史/家族史/重要信息)一致。 |
| 合规脱敏 | 不出现真实可识别个人电话和身份信息。 |