Data_Analysis/数据准备过程/模拟数据生成-提示词/生成药品不良事件&投诉模拟数据.md

182 lines
8.3 KiB
Markdown
Raw Blame History

This file contains ambiguous Unicode characters

This file contains Unicode characters that might be confused with other characters. If you think that this is intentional, you can safely ignore this warning. Use the Escape button to reveal them.

生成药品不良事件&投诉模拟数据
# 角色与目标
你是数据分析助手。请根据本地 Excel 表头,生成 1000 条「药品不良事件与投诉」模拟数据(仅用于内部分析、培训或演示,非真实药物警戒上报数据),并导出为新的 Excel 文件。
# 1. 输入文件(必须先读)
路径:`贝朗数据/药品不良事件&投诉数据-表头.xlsx`(若工作区根目录不同,以用户提供的「贝朗数据」文件夹为准)。
工作表名:`Tabelle1`(与源文件一致)。
表头共 70 列,必须严格保持列名与顺序不变(第 1 行原样保留):
| 序号 | 字段名 |
|---|---|
| 1 | Case owner |
| 2 | reporter |
| 3 | Inbound Channel |
| 4 | Local PV ReceiptDate含原表头换行说明 |
| 5 | Initial data entry date |
| 6 | Reportability to HA |
| 7 | Due Date to ADR Center |
| 8 | AER# |
| 9 | CC# |
| 10 | Submit date |
| 11 | 反馈码 |
| 12 | 首次/跟踪报告 |
| 13 | 预期/非预期 |
| 14 | 报告类型 |
| 15 | 严重不良反应 |
| 16 | 报告单位类别 |
| 17 | 性别 |
| 18 | 出生日期 |
| 19 | 年龄 |
| 20 | 年龄单位 |
| 21 | 民族 |
| 22 | 体重 |
| 23 | 既往药品不良反应 |
| 24 | 家族药品不良反应 |
| 25 | 不良反应发生时间 |
| 26 | 不良反应过程描述 |
| 27 | 不良反应结果 |
| 28 | 后遗症表现 |
| 29 | 死亡时间 |
| 30 | 直接死因 |
| 31 | 停药减药后反应是否减轻或消失 |
| 32 | 再次使用可疑药是否出现同样反应 |
| 33 | 对原患疾病影响 |
| 34 | 报告人评价 |
| 35 | 报告单位评价 |
| 36 | 报告日期 |
| 37 | 信息来源 |
| 38 | 备注 |
| 39 | 原患疾病名称 |
| 40 | 家族药品不良反应[不良反应名称] |
| 41 | 家族药品不良反应[商品名称] |
| 42 | 家族药品不良反应[严重程度] |
| 43 | 既往药品不良反应[不良反应名称] |
| 44 | 既往药品不良反应[严重程度] |
| 45 | 既往药品不良反应[商品名称] |
| 46 | 相关重要信息 |
| 47 | 相关重要信息(其他) |
| 48 | 怀疑/合并 |
| 49 | 序号 |
| 50 | 批准文号 |
| 51 | 通用名称 |
| 52 | 商品名称 |
| 53 | 剂型 |
| 54 | 生产厂家 |
| 55 | 生产批号 |
| 56 | 用量 |
| 57 | 用量单位 |
| 58 | 用药-次数 |
| 59 | 用药-日数 |
| 60 | 给药途径 |
| 61 | 用药开始时间 |
| 62 | 用药结束时间 |
| 63 | 用药原因 |
| 64 | 不良反应名称 |
| 65 | 严重程度 |
| 66 | 不良反应名称PT |
| 67 | 不良反应名称SOC |
| 68 | 省 |
| 69 | 市 |
| 70 | 区 |
# 2. 各列填充规则170
以下规则适用于第 21001 行;第 1 行为原表头,不得改动。
## A. 病例流转与时效字段111
- `Case owner`、`reporter`:使用岗位化姓名(匿名化),格式统一,避免真实个人敏感信息。
- `Inbound Channel`:枚举值(如 `电话`、`邮件`、`销售反馈`、`医疗机构上报`、`监管转入`)。
- 日期逻辑必须满足:
`Local PV ReceiptDate <= Initial data entry date <= Submit date`
`Reportability to HA=是`,则 `Due Date to ADR Center` 必填,且应晚于 `ReceiptDate`
- `AER#`、`CC#`:各自唯一编码,建议格式如 `AER-YYYY-000001`、`CC-YYYY-000001`。
- `反馈码`:有限枚举(如 `有效`、`无效`、`待补充`)。
## B. 报告属性与患者基本信息1224
- `首次/跟踪报告`:枚举 `首次`、`跟踪`,若为跟踪,`AER#` 应复用同案例主编号规则。
- `预期/非预期`、`报告类型`、`严重不良反应`、`报告单位类别`使用固定枚举,避免自由文本混乱。
- 患者信息联动:`出生日期`、`年龄`、`年龄单位`必须可互相解释(允许有轻微误差);`体重`为数值型并在合理区间。
- `既往药品不良反应`、`家族药品不良反应`与其展开字段4045保持一致若主字段为“无”对应展开字段应空或 `N/A`
## C. 反应发生与医学结局2538
- `不良反应发生时间`应晚于或等于 `用药开始时间`(若有)。
- `不良反应过程描述`为中文临床叙述,简洁、可读、与药品信息一致。
- `不良反应结果`、`后遗症表现`、`死亡时间`、`直接死因`联动:
- 非死亡病例:`死亡时间/直接死因`应为空;
- 死亡病例:`严重程度`应为重度相关,且死因可解释。
- `停药减药后反应是否减轻或消失`、`再次使用可疑药是否出现同样反应`使用标准枚举(是/否/不详/未再用)。
- `报告人评价`与`报告单位评价`给出一致但不完全重复的专业结论文本。
- `报告日期`通常晚于 `不良反应发生时间`
- `信息来源`、`备注`可补充场景,但不得出现真实可识别隐私信息。
## D. 既往/家族史扩展与重要信息3947
- `原患疾病名称`使用规范疾病名(示例:高血压、糖尿病、慢性肾病等)。
- 家族史与既往史展开字段4045建议结构化填写
- 不良反应名称
- 涉及商品名称
- 严重程度
- `相关重要信息`可枚举(如 `肝功能异常`、`肾功能异常`、`妊娠`、`过敏体质`、`其他`
若为`其他``相关重要信息(其他)`必须填写。
## E. 用药信息子表4863
- `怀疑/合并`:枚举 `怀疑药品`、`合并用药`,至少有一条怀疑药品记录。
- `序号`同一病例内递增序号若每行仅1药可统一为 1
- `批准文号`、`通用名称`、`商品名称`、`剂型`、`生产厂家`、`生产批号`需互相匹配且风格真实;文号可模拟但格式需合理。
- `用量`为数值,`用量单位`mg/ml/片等)与剂型匹配。
- `用药-次数`、`用药-日数`与`用药开始/结束时间`可互相解释(结束时间应不早于开始时间)。
- `给药途径`(口服/静脉滴注/皮下/肌注等)需与药品剂型和反应场景匹配。
- `用药原因`与`原患疾病名称`存在医学关联。
## F. 不良反应标准术语与地区字段6470
- `不良反应名称`使用中文医学术语;`不良反应名称PT`、`SOC`与其对应(可参考 MedDRA 术语风格)。
- `严重程度`与上文 `严重不良反应`一致,不得矛盾。
- `省/市/区`三级行政区必须逻辑一致,不跨省错配;可与报告单位地理分布相匹配。
# 3. 真实感与跨列关联(核心)
- **时间链路闭环**:获知日期、录入日期、上报日期、发生日期、用药起止日期必须前后合理。
- **医学逻辑闭环**:可疑药品 -> 用药信息 -> 不良反应名称/PT/SOC -> 严重程度 -> 结局描述应一致。
- **结构化字段闭环**:主字段与展开字段(既往史、家族史、重要信息)不冲突。
- **编码唯一性**`AER#` 和 `CC#` 全表唯一;若设计跟踪报告,应保持主案例可追踪。
- **文本去模板化**:过程描述和评价需同类可变体,不得 1000 条高度重复同一句。
# 4. 输出
新建 Excel 文件,保存到 `贝朗数据` 文件夹下。
建议文件名:`药品不良事件&投诉数据-模拟1000条-YYYYMMDD.xlsx`(日期为生成当日)。
工作表名仍为 `Tabelle1`;第 1 行为原表头,第 21001 行为数据。
列顺序与列名与源表头文件完全一致(包括原始表头中的换行字符)。
# 5. 交付时请用文字简要说明
- 病例来源渠道、报告类型、严重程度的大致分布口径。
- 用药信息与反应术语PT/SOC的映射口径与来源说明如为归纳模拟需明确说明
- 日期与状态字段的约束规则(尤其上报时限字段)。
- 明确声明:本文件为合成数据,不代表真实药物警戒病例或监管上报记录。
---
## 附:执行自检清单
| 检查项 | 合格标准 |
|---|---|
| 行数 | 总行数 1001含表头数据行 1000。 |
| 列结构 | 70 列列名与顺序与 `药品不良事件&投诉数据-表头.xlsx` 完全一致。 |
| 编码规则 | `AER#`、`CC#` 唯一;跟踪报告可追踪。 |
| 时间逻辑 | 关键日期前后关系正确,无明显逆序。 |
| 术语一致 | 反应中文名、PT、SOC、严重程度互相匹配。 |
| 字段联动 | 主字段与展开字段(既往史/家族史/重要信息)一致。 |
| 合规脱敏 | 不出现真实可识别个人电话和身份信息。 |