7.7 KiB
7.7 KiB
生成入院量模拟数据
角色与目标
你是数据分析助手。请根据本地 Excel 表头,生成 1000 条「贝朗(B. Braun)产品在医院端入院/使用相关业务口径」的模拟数据(仅用于内部分析、培训或演示,非真实经营报表数据),并导出为新的 Excel 文件。
1. 输入文件(必须先读)
路径:贝朗数据/入院量-表头.xlsx(若工作区根目录不同,以用户提供的「贝朗数据」文件夹为准)。
| 列 | 字段名 |
|---|---|
| A | Year |
| B | Month |
| C | HospitalName |
| D | HospitalCode |
| E | DealerName |
| F | DealerCode |
| G | Province |
| H | City |
| I | GlobalDivision |
| J | LocalDivision |
| K | BU |
| L | ProductLine |
| M | ProductLineType |
| N | Material |
| O | MaterialDesc |
| P | CY Amt |
| Q | LY Amt |
| R | Growth Amt |
| S | Growth% Amt |
| T | CY Qty |
| U | LY Qty |
| V | Growth Qty |
| W | Growth% Qty |
| X | CY LE AMT |
工作表名:Sheet1(与源文件一致)。
2. 各列填充规则(A–X)
以下规则适用于第 2–1001 行数据行;第 1 行为表头,不得改动列名与列顺序。
A 列 Year
- 建议取近 2~3 年(如
2024、2025、2026)的整数年份。 - 与 B 列
Month组合后应形成合理时间分布,避免 1000 条全部落在同一年同一月。
B 列 Month
- 取值范围
1~12(整数)。 - 与 A 列匹配,允许季节性波动(如 Q4 数值略高)但不要机械重复。
C 列 HospitalName
- 采用中国境内医院全称风格(如「××大学附属××医院」「××省人民医院」)。
- 与 G/H(省/市)保持一致,避免城市与医院明显冲突。
- 全表使用多个医院,避免极端集中到单家医院。
D 列 HospitalCode
- 为
HospitalName的稳定唯一编码(同一医院编码必须一致)。 - 格式建议:
H+ 5~8 位数字或字母数字组合(如H310001)。 - 不同医院不得复用同一编码。
E 列 DealerName
- 使用经销商/渠道商公司名称风格(如「××医疗器械有限公司」「××医药科技有限公司」)。
- 同一医院可出现多个经销商;同一经销商也可服务多个医院。
F 列 DealerCode
- 为
DealerName的稳定唯一编码(同名同码、异名异码)。 - 格式建议:
D+ 4~8 位数字(如D10258)。
G 列 Province
- 省级行政区名称(如
上海市、浙江省、广东省)。 - 必须与 H 列
City形成真实的省市归属关系。
H 列 City
- 地级市/直辖市名称(如
上海市、杭州市、广州市)。 - 与 C 列医院所在地、G 列省份一致。
I 列 GlobalDivision
- 使用有限枚举值,建议按全球业务大类,如
Hospital Care、Aesculap、Avitum。 - 与 J/K/L/M 保持层级逻辑一致,不要跨事业部乱配。
J 列 LocalDivision
- 中国本地事业部分组名称(如
输液治疗、外科、透析)。 - 与 I 列映射稳定(同一 LocalDivision 不要映射到多个互斥 GlobalDivision)。
K 列 BU
- 业务单元名称(如
IV Therapy BU、Renal Care BU、Surgical BU)。 - 与 J/L 保持业务口径一致,避免出现不相关组合。
L 列 ProductLine
- 产品线名称(如
静脉输注、透析耗材、缝线与外科耗材)。 - 与 M/N/O 联动:同一产品线应对应合理的物料与描述。
M 列 ProductLineType
- 产品线子类型(如
输液器、留置针、透析器、缝线)。 - 建议作为 L 列的细分层,不可脱离 L 列独立随机。
N 列 Material
- 物料编码,建议使用稳定格式(如
MAT+ 6 位数字,例MAT203145)。 - 同一 O 列
MaterialDesc对应固定 Material 编码。 - 不同物料编码应可重复出现(代表多月或多医院销售/入院量)。
O 列 MaterialDesc
- 物料中文描述,体现规格和品类信息(如「一次性使用静脉留置针 20G」)。
- 与 M/N 严格一致,避免一个编码对应多种冲突描述。
P 列 CY Amt
- 当年金额(Current Year Amount),数值型,建议保留 2 位小数。
- 取值必须非负;建议以业务真实感设置在合理范围(如几千到几十万不等)。
Q 列 LY Amt
- 去年同期金额(Last Year Amount),数值型,建议保留 2 位小数。
- 允许部分记录为 0(新品/新医院场景),但比例不宜过高(建议 <10%)。
R 列 Growth Amt
- 由公式逻辑生成:
Growth Amt = CY Amt - LY Amt。 - 应与 P/Q 精确一致,不可独立随机。
S 列 Growth% Amt
- 由公式逻辑生成:当
LY Amt > 0时,Growth% Amt = Growth Amt / LY Amt。 - 当
LY Amt = 0时,可统一规则为0或空值,且需在交付说明中说明处理口径。 - 建议保留 4 位小数或百分比显示格式(如
0.1234对应12.34%)。
T 列 CY Qty
- 当年数量(Current Year Quantity),整数型(建议 >=0)。
- 与 P 列金额保持大致单价一致(同一物料单价波动不应过大)。
U 列 LY Qty
- 去年同期数量,整数型(建议 >=0)。
- 可少量为 0(新品导入场景),但应与 Q 列口径一致。
V 列 Growth Qty
- 由公式逻辑生成:
Growth Qty = CY Qty - LY Qty。 - 应与 T/U 严格一致。
W 列 Growth% Qty
- 由公式逻辑生成:当
LY Qty > 0时,Growth% Qty = Growth Qty / LY Qty。 - 当
LY Qty = 0时按统一口径处理(0 或空值),并在交付说明注明。
X 列 CY LE AMT
- 当年预计金额(Latest Estimate Amount),数值型,建议保留 2 位小数。
- 与 P 列相关但不应完全相同;建议围绕
CY Amt在合理区间波动(如0.9x~1.15x)。 - 禁止出现明显异常值(如负数、极端大值)破坏整体分布。
3. 真实感与跨列关联(核心,与第 2 节配合)
- 组织维度关联:
HospitalName/HospitalCode、DealerName/DealerCode必须一一稳定映射。 - 地理维度关联:
Province/City/HospitalName三列一致,不得出现跨省错配。 - 产品维度关联:
GlobalDivision → LocalDivision → BU → ProductLine → ProductLineType → Material → MaterialDesc需层级一致。 - 指标维度关联:
Growth Amt与Growth% Amt由金额推导;Growth Qty与Growth% Qty由数量推导,不能脱离基础值随机填。 - 经营合理性:金额与数量保持可解释的单价区间;避免同一物料在相邻月份出现无理由 10 倍跳变。
4. 输出
新建 Excel 文件,保存到 贝朗数据 文件夹下。
建议文件名:入院量数据-模拟1000条-YYYYMMDD.xlsx(日期为生成当日)。
工作表名仍为 Sheet1;第 1 行为原表头,第 2–1001 行为数据。
列顺序与列名与源表头文件完全一致,便于后续 Power BI 或透视分析使用。
5. 交付时请用文字简要说明
- 组织维度(医院、经销商)与产品维度(事业部、产品线、物料)的生成口径。
- 金额/数量及增长率字段的计算口径(尤其 LY=0 时的处理规则)。
- 各年度、主要产品线、主要省份的数据占比概览。
- 明确声明:本文件为合成数据,不代表真实业务入院量或销售数据。
附:执行自检清单
| 检查项 | 合格标准 |
|---|---|
| 行数 | 总行数为 1001(含表头),数据行 1000。 |
| 列结构 | 24 列列名与顺序与 入院量-表头.xlsx 完全一致。 |
| 编码一致性 | 同一医院/经销商/物料名称对应唯一编码,不发生混码。 |
| 计算一致性 | R/S/V/W 与 P/Q/T/U 计算逻辑一致,无公式冲突。 |
| 业务合理性 | 省市医院匹配、产品层级匹配、金额数量分布无明显异常。 |