Data_Analysis/数据/#数据与表结构.md

186 lines
9.9 KiB
Markdown
Raw Permalink Blame History

This file contains ambiguous Unicode characters

This file contains Unicode characters that might be confused with other characters. If you think that this is intentional, you can safely ignore this warning. Use the Escape button to reveal them.

#数据与表结构
## 一、数据概览
### 1.1 数据源
| 数据表 | Sheet | 记录数 | 时间范围 | 核心内容 |
|--------|-------|--------|----------|----------|
| 不良事件数据 | POWER BI 总信息 | 1,000 条 | 2023-12 ~ 2026-04 | 上报至监管的不良事件记录 |
| 入院量数据 | Sheet1 | 1,000 条 | 2024 ~ 2026按月 | 各医院各产品的销售金额与数量 |
| 质量投诉数据 | complaint form | 1,000 条 | 2023-08 ~ 2026-04 | 客户质量投诉的全生命周期记录 |
所有数据为模拟数据,并且假设均已清理、规整完毕。
### 1.2 各表字段清单
**不良事件表13 字段)**
| 字段 | 说明 | 典型值 |
|------|------|--------|
| 报告编码 | 不良事件唯一编号 | SIM-2024-000001 |
| 单位名称 | 报告医院 | 15 家三甲医院 |
| 事业线 | 产品所属事业线 | 外科产品、透析产品、输液治疗、诊断/监测耗材 |
| 产品名称 | 涉及产品 | 13 种产品 |
| 注册证编号 | 产品注册证号 | 国械注进/国械注准 |
| 注册人 | 注册持有人 | 贝朗医疗(苏州)有限公司 |
| 型号 | 产品型号 | 30 种型号 |
| 产品批号 | 生产批号 | — |
| 伤害 | 是否造成伤害 | 全部为"是" |
| 伤害表现 | 伤害的临床表现 | 35 种表现(感染、出血、疼痛、静脉炎等) |
| 器械故障表现 | 器械故障描述 | 53 种故障表现 |
| 审核日期 | 事件审核日期 | — |
**入院量数据24 字段)**
| 字段 | 说明 | 典型值 |
|------|------|--------|
| Year / Month | 销售年月 | 20242026 |
| HospitalName / HospitalCode | 医院名称及代码 | 10 家医院 |
| DealerName / DealerCode | 经销商名称及代码 | 8 家经销商 |
| Province / City | 省市 | 10 省市 |
| GlobalDivision | 全球事业部 | Avitum、Hospital Care、Aesculap |
| LocalDivision | 本地事业部 | 透析、输液治疗、外科 |
| BU | 业务单元 | Renal Care BU、IV Therapy BU、Surgical BU |
| ProductLine | 产品线 | 透析耗材、静脉输注、缝线与外科耗材、营养输注 |
| ProductLineType | 产品线类型 | 透析器、留置针、可吸收缝线等 8 种 |
| Material / MaterialDesc | 物料号 / 物料描述 | 8 种物料 |
| CY Amt / LY Amt | 当年/去年销售金额 | — |
| Growth Amt / Growth% Amt | 金额增长及增长率 | — |
| CY Qty / LY Qty | 当年/去年销售数量 | — |
| Growth Qty / Growth% Qty | 数量增长及增长率 | — |
| CY LE AMT | 当年最新预测金额 | — |
**质量投诉数据31 字段)**
| 字段 | 说明 | 典型值 |
|------|------|--------|
| C3编号 | 投诉唯一编号 | C3-2026-000001 |
| 型号 / 批号 / 序列号 | 产品标识 | — |
| 生产企业名称 | 生产企业 | 贝朗医疗(苏州/上海) |
| 注册证号 | 产品注册证 | 国械注进/国械注准 |
| 产品名称 | 投诉产品 | 5 种核心产品 |
| 医院名称 | 投诉医院 | 10 家医院 |
| 投诉联系人 / 联系人电话 | 医院端联系方式 | — |
| 故障类型 | 故障大类 | 渗漏、断裂、流速异常、包装破损、连接不牢、堵塞、标签不清 |
| 投诉详情(中文) | 故障详细描述 | 自由文本 |
| 上报人 | 公司内上报人 | 护理部、临床工程、设备科、质控办 |
| BU | 业务单元 | Renal Care BU、IV Therapy BU、Surgical BU |
| C3登记日期 / C3登记月 | 投诉登记时间 | — |
| 是否不良事件 | 是否升级为不良事件 | 是(252条) / 否(748条) |
| 不良事件(否) | 未升级原因 | 未造成患者伤害、使用前发现、仅质量缺陷 |
| 上报坏品数量 / 坏品退回QA / 退回原厂 | 样品退回链路数量 | — |
| 调查报告完成日期 | 调查完成时间 | — |
| 调查报告(处理意见) | 英文处理意见 | Need more info、No defect found、Training reinforced |
| 调查报告中文(处理意见) | 中文处理意见 | — |
| 调查结论(处理结果) | 调查结论 | 产品缺陷成立、未复现、操作不当、运输损伤、资料不足 |
| 赔付结论 | 赔付方式 | 换货、折让、退款、无赔付、其他协商处理 |
| 关闭日期 | 投诉关闭时间 | — |
| 投诉状态 | 当前状态 | 已关闭、调查中、新建、待补充 |
| 有样品返回 | 是否有样品退回 | 是/— |
| 事业部 | 中文事业部名称 | 透析、输液治疗、外科 |
| 例数 | 涉及患者例数 | — |
---
## 二、数据关系梳理
### 2.1 三张表用途说明
- 不良事件数据表来源于监管机构,最初报告者是医院,由医院向监管机构报告,监管机构再将报告创数给器械企业;
- 医院报告时间的原因有多种:
-确实为值得关注的不良事件,希望引起企业的重视;
-为了满足报告数量要求,满足监管部门的任务;
-与患者发生纠纷,将事件及时告知。
### 2.2 入院数量表
- 本表数据为企业提供,数据准确;
### 2.3 质量投诉数据
- 数据真实性可以接受,不用担心虚假数据;
- 可能存在即为质量投诉,同时出现在不良事件报告中的数据。
### 2.1 三表关联关系图
#### 三表数据关联分析
1. **质量投诉数据 ↔ 入院量数据**
- 分析投诉率(某产品/医院的投诉数 ÷ 入院量),评估不同医院、产品或时间段下的投诉发生频率。
- 关键关联字段医院名称、产品名称需模糊匹配、BU/事业部。
2. **不良事件数据 ↔ 入院量数据**
- 用于计算不良事件发生率,观察事件报告的分布与产品/医院相关性。
- 关键关联字段医院名称、产品名称需模糊匹配、BU/事业部。
3. **质量投诉数据 ↔ 不良事件数据**
- 判断是否存在“同一投诉已升级为不良事件”的重合情形。重合部分有更高分析价值,可用于过程追溯和根因分析。
- 关键字段:投诉唯一编号、是否不良事件、医院名称、产品名称、注册证号、型号、批号、时间等。
---
#### 结构与字段关系交互图
```
(1) (3)
┌───────────────┐ 医院名称/产品名称 ┌───────────────┐
│ │◄──────────────────────────────────│ │
│ 入院量数据 │ │ 质量投诉数据 │
│ (Sales Data) │──────────────────────────────────►│ (Complaint) │
│ │ 医院名称/产品名称/BU/事业部 │ │
└───────────────┘ └───────────────┘
▲ │
│ │
│ │
│ (2) 是否不良事件/投诉编号/产品信息/时间
│ │
┌───────────────┐ 医院名称/产品/时间等 ┌──────┴────────┐
│ │◄─────────────────────────────────│ │
│ 不良事件数据 │ │ 质量投诉数据 │
│ (AdverseEvent)│─────────────────────────────────►│ (Complaint) │
│ │ 医院名称/产品/BU/事业部 │ │
└───────────────┘ └───────────────┘
医院名称/产品名称/BU/事业部
┌───────────────┐
│ 入院量数据 │
└───────────────┘
```
### 2.2 关键关联字段详解
#### (一)强关联字段(可直接 Join
| 关联维度 | 表 A 字段 | 表 B 字段 | 匹配方式 | 重叠情况 |
|----------|-----------|-----------|----------|----------|
| **医院** | 入院量.HospitalName | 投诉.医院名称 | 精确匹配 | 10 家医院完全重叠 |
| **医院** | 入院量.HospitalName | 不良事件.单位名称 | 精确匹配 | 10 家重叠(不良事件多 5 家) |
| **医院** | 投诉.医院名称 | 不良事件.单位名称 | 精确匹配 | 10 家完全重叠 |
| **BU** | 入院量.BU | 投诉.BU | 精确匹配 | 3 个 BU 完全一致 |
| **事业部** | 入院量.LocalDivision | 投诉.事业部 | 精确匹配 | 透析、输液治疗、外科 |
| **型号** | 不良事件.型号 | 投诉.型号 | 精确匹配 | 7 个型号重叠 |
#### (二)投诉 → 不良事件的上下游关系
质量投诉数据中的 **"是否不良事件"** 字段是连接投诉表与不良事件表的核心业务逻辑:
- **"是"252 条25.2%**:该投诉已升级为不良事件,理论上在不良事件表中应有对应记录
- **"否"748 条74.8%**:未升级,原因记录在"不良事件(否)"字段
### 2.3 数据维度层级关系
```
GlobalDivision (Avitum / Hospital Care / Aesculap)
└─ LocalDivision / 事业部 (透析 / 输液治疗 / 外科)
└─ BU (Renal Care BU / IV Therapy BU / Surgical BU)
└─ ProductLine (透析耗材 / 静脉输注 / 缝线与外科耗材 / 营养输注)
└─ ProductLineType (透析器 / 留置针 / 可吸收缝线 / ...)
└─ Material / 产品名称 (血液透析器 1.4m² / ...)
└─ 型号 (HD-180 / Introcan Safety 20G / ...)
└─ 批号 (单个生产批次)
```
---