生成药品不良事件&投诉模拟数据 # 角色与目标 你是数据分析助手。请根据本地 Excel 表头,生成 1000 条「药品不良事件与投诉」模拟数据(仅用于内部分析、培训或演示,非真实药物警戒上报数据),并导出为新的 Excel 文件。 # 1. 输入文件(必须先读) 路径:`贝朗数据/药品不良事件&投诉数据-表头.xlsx`(若工作区根目录不同,以用户提供的「贝朗数据」文件夹为准)。 工作表名:`Tabelle1`(与源文件一致)。 表头共 70 列,必须严格保持列名与顺序不变(第 1 行原样保留): | 序号 | 字段名 | |---|---| | 1 | Case owner | | 2 | reporter | | 3 | Inbound Channel | | 4 | Local PV ReceiptDate(含原表头换行说明) | | 5 | Initial data entry date | | 6 | Reportability to HA | | 7 | Due Date to ADR Center | | 8 | AER# | | 9 | CC# | | 10 | Submit date | | 11 | 反馈码 | | 12 | 首次/跟踪报告 | | 13 | 预期/非预期 | | 14 | 报告类型 | | 15 | 严重不良反应 | | 16 | 报告单位类别 | | 17 | 性别 | | 18 | 出生日期 | | 19 | 年龄 | | 20 | 年龄单位 | | 21 | 民族 | | 22 | 体重 | | 23 | 既往药品不良反应 | | 24 | 家族药品不良反应 | | 25 | 不良反应发生时间 | | 26 | 不良反应过程描述 | | 27 | 不良反应结果 | | 28 | 后遗症表现 | | 29 | 死亡时间 | | 30 | 直接死因 | | 31 | 停药减药后反应是否减轻或消失 | | 32 | 再次使用可疑药是否出现同样反应 | | 33 | 对原患疾病影响 | | 34 | 报告人评价 | | 35 | 报告单位评价 | | 36 | 报告日期 | | 37 | 信息来源 | | 38 | 备注 | | 39 | 原患疾病名称 | | 40 | 家族药品不良反应[不良反应名称] | | 41 | 家族药品不良反应[商品名称] | | 42 | 家族药品不良反应[严重程度] | | 43 | 既往药品不良反应[不良反应名称] | | 44 | 既往药品不良反应[严重程度] | | 45 | 既往药品不良反应[商品名称] | | 46 | 相关重要信息 | | 47 | 相关重要信息(其他) | | 48 | 怀疑/合并 | | 49 | 序号 | | 50 | 批准文号 | | 51 | 通用名称 | | 52 | 商品名称 | | 53 | 剂型 | | 54 | 生产厂家 | | 55 | 生产批号 | | 56 | 用量 | | 57 | 用量单位 | | 58 | 用药-次数 | | 59 | 用药-日数 | | 60 | 给药途径 | | 61 | 用药开始时间 | | 62 | 用药结束时间 | | 63 | 用药原因 | | 64 | 不良反应名称 | | 65 | 严重程度 | | 66 | 不良反应名称(PT) | | 67 | 不良反应名称(SOC) | | 68 | 省 | | 69 | 市 | | 70 | 区 | # 2. 各列填充规则(1–70) 以下规则适用于第 2–1001 行;第 1 行为原表头,不得改动。 ## A. 病例流转与时效字段(1–11) - `Case owner`、`reporter`:使用岗位化姓名(匿名化),格式统一,避免真实个人敏感信息。 - `Inbound Channel`:枚举值(如 `电话`、`邮件`、`销售反馈`、`医疗机构上报`、`监管转入`)。 - 日期逻辑必须满足: `Local PV ReceiptDate <= Initial data entry date <= Submit date`。 若 `Reportability to HA=是`,则 `Due Date to ADR Center` 必填,且应晚于 `ReceiptDate`。 - `AER#`、`CC#`:各自唯一编码,建议格式如 `AER-YYYY-000001`、`CC-YYYY-000001`。 - `反馈码`:有限枚举(如 `有效`、`无效`、`待补充`)。 ## B. 报告属性与患者基本信息(12–24) - `首次/跟踪报告`:枚举 `首次`、`跟踪`,若为跟踪,`AER#` 应复用同案例主编号规则。 - `预期/非预期`、`报告类型`、`严重不良反应`、`报告单位类别`使用固定枚举,避免自由文本混乱。 - 患者信息联动:`出生日期`、`年龄`、`年龄单位`必须可互相解释(允许有轻微误差);`体重`为数值型并在合理区间。 - `既往药品不良反应`、`家族药品不良反应`与其展开字段(40–45)保持一致:若主字段为“无”,对应展开字段应空或 `N/A`。 ## C. 反应发生与医学结局(25–38) - `不良反应发生时间`应晚于或等于 `用药开始时间`(若有)。 - `不良反应过程描述`为中文临床叙述,简洁、可读、与药品信息一致。 - `不良反应结果`、`后遗症表现`、`死亡时间`、`直接死因`联动: - 非死亡病例:`死亡时间/直接死因`应为空; - 死亡病例:`严重程度`应为重度相关,且死因可解释。 - `停药减药后反应是否减轻或消失`、`再次使用可疑药是否出现同样反应`使用标准枚举(是/否/不详/未再用)。 - `报告人评价`与`报告单位评价`给出一致但不完全重复的专业结论文本。 - `报告日期`通常晚于 `不良反应发生时间`。 - `信息来源`、`备注`可补充场景,但不得出现真实可识别隐私信息。 ## D. 既往/家族史扩展与重要信息(39–47) - `原患疾病名称`使用规范疾病名(示例:高血压、糖尿病、慢性肾病等)。 - 家族史与既往史展开字段(40–45)建议结构化填写: - 不良反应名称 - 涉及商品名称 - 严重程度 - `相关重要信息`可枚举(如 `肝功能异常`、`肾功能异常`、`妊娠`、`过敏体质`、`其他`); 若为`其他`,`相关重要信息(其他)`必须填写。 ## E. 用药信息子表(48–63) - `怀疑/合并`:枚举 `怀疑药品`、`合并用药`,至少有一条怀疑药品记录。 - `序号`:同一病例内递增序号(若每行仅1药,可统一为 1)。 - `批准文号`、`通用名称`、`商品名称`、`剂型`、`生产厂家`、`生产批号`需互相匹配且风格真实;文号可模拟但格式需合理。 - `用量`为数值,`用量单位`(mg/ml/片等)与剂型匹配。 - `用药-次数`、`用药-日数`与`用药开始/结束时间`可互相解释(结束时间应不早于开始时间)。 - `给药途径`(口服/静脉滴注/皮下/肌注等)需与药品剂型和反应场景匹配。 - `用药原因`与`原患疾病名称`存在医学关联。 ## F. 不良反应标准术语与地区字段(64–70) - `不良反应名称`使用中文医学术语;`不良反应名称(PT)`、`(SOC)`与其对应(可参考 MedDRA 术语风格)。 - `严重程度`与上文 `严重不良反应`一致,不得矛盾。 - `省/市/区`三级行政区必须逻辑一致,不跨省错配;可与报告单位地理分布相匹配。 # 3. 真实感与跨列关联(核心) - **时间链路闭环**:获知日期、录入日期、上报日期、发生日期、用药起止日期必须前后合理。 - **医学逻辑闭环**:可疑药品 -> 用药信息 -> 不良反应名称/PT/SOC -> 严重程度 -> 结局描述应一致。 - **结构化字段闭环**:主字段与展开字段(既往史、家族史、重要信息)不冲突。 - **编码唯一性**:`AER#` 和 `CC#` 全表唯一;若设计跟踪报告,应保持主案例可追踪。 - **文本去模板化**:过程描述和评价需同类可变体,不得 1000 条高度重复同一句。 # 4. 输出 新建 Excel 文件,保存到 `贝朗数据` 文件夹下。 建议文件名:`药品不良事件&投诉数据-模拟1000条-YYYYMMDD.xlsx`(日期为生成当日)。 工作表名仍为 `Tabelle1`;第 1 行为原表头,第 2–1001 行为数据。 列顺序与列名与源表头文件完全一致(包括原始表头中的换行字符)。 # 5. 交付时请用文字简要说明 - 病例来源渠道、报告类型、严重程度的大致分布口径。 - 用药信息与反应术语(PT/SOC)的映射口径与来源说明(如为归纳模拟需明确说明)。 - 日期与状态字段的约束规则(尤其上报时限字段)。 - 明确声明:本文件为合成数据,不代表真实药物警戒病例或监管上报记录。 --- ## 附:执行自检清单 | 检查项 | 合格标准 | |---|---| | 行数 | 总行数 1001(含表头),数据行 1000。 | | 列结构 | 70 列列名与顺序与 `药品不良事件&投诉数据-表头.xlsx` 完全一致。 | | 编码规则 | `AER#`、`CC#` 唯一;跟踪报告可追踪。 | | 时间逻辑 | 关键日期前后关系正确,无明显逆序。 | | 术语一致 | 反应中文名、PT、SOC、严重程度互相匹配。 | | 字段联动 | 主字段与展开字段(既往史/家族史/重要信息)一致。 | | 合规脱敏 | 不出现真实可识别个人电话和身份信息。 |