ユーザー・ディメンションテーブル
概要
ユーザー・ディメンションテーブルは、ユーザーに関する属性を管理するテーブルです。
このテーブルでは、ユーザー ID、性別、年齢などの基本的なユーザー情報に加え、初回注文日や初回注文商品などの属性も管理します。これにより、ユーザーの属性を考慮した分析や、初回購入に関する集計などが可能になります。
物理レイヤー
1. dim_user
基本情報
dim_user:
description: "ユーザー・ディメンションテーブル"
location: "BigQuery"
full_name: "enterprise-dw-376005.mart.dim_user"
surrogate_key: "user_key"
primary_keys: ["user_id", "stream_id", "company_id"]
カラム
1. user_key
- 日本語名: ユーザーキー
- データ型:
string - 説明:
user_id、stream_id、company_idを組み合わせたサロゲートキー。結合キーとして使用する。
度数分布表
select
user_key,
count(*) as record_count
from `enterprise-dw-376005.mart.dim_user`
group by 1
order by 2 desc
limit 10
| user_key | record_count |
|---|---|
| 00000000000000000000000000000000 | 1 |
| 00000015eb0065720956bf3cf8354784 | 1 |
| 0000002a814134325224f396ea3467e9 | 1 |
| 00000424de034dae4d9a0a2d8229d3e5 | 1 |
| 0000095a355dc57e9602a8007a845ba1 | 1 |
| 00000be2f92a3cf222d5d1128e21a0ae | 1 |
| 00000fee2be8057dd67f54c08d62f919 | 1 |
| 00001059f1bf540e5aa06ed05d3a253b | 1 |
| 00001467e61782a3e4b42a45fc145f86 | 1 |
| 00001a3908fc5001721fd7b529605dbd | 1 |
2. first_order_date_key
- 日本語名: 初回注文日キー
- データ型:
string - 説明: 初回注文日のサロゲートキー。
度数分布表
select
first_order_date_key,
count(*) as record_count
from `enterprise-dw-376005.mart.dim_user`
group by 1
order by 2 desc
limit 10
| first_order_date_key | record_count |
|---|---|
| 20230124 | 10358 |
| 20220718 | 9478 |
| 20230609 | 8476 |
| 20230712 | 7123 |
| 20230921 | 6863 |
| 20230610 | 6790 |
| 20231129 | 6567 |
| 20241020 | 6501 |
| 20240717 | 6210 |
| 20240716 | 5726 |
3. first_product_key
- 日本語名: 初回注文商品キー
- データ型:
string - 説明: 初回注文商品のサロゲートキー。
度数分布表
select
first_product_key,
count(*) as record_count
from `enterprise-dw-376005.mart.dim_user`
group by 1
order by 2 desc
limit 10
| first_product_key | record_count |
|---|---|
| 1c33269865c71afc14e3bef93a86f8b9 | 531095 |
| 93bb94b54e18800cbf8414496df25dd2 | 184329 |
| f87a622968ffa3a6c38970c66346776d | 161720 |
| 748ac6f8035c1fe67b38607fb218b2be | 160067 |
| 7f63efe4dc5756e7d0c574dcf31edede | 158069 |
| 7c999a1ec5032fe5e8cf64a7257d5412 | 114954 |
| d514581a78aeb7b1324a1023a7153983 | 79938 |
| 0cb6ac19f2815d0b41aa0b52fda109c6 | 79877 |
| 92a3ac7d80e0b73758273560c841e4d8 | 73517 |
| 4878cb50e7a68758b91c3e30985f2f3b | 70994 |
4. user_id
- 日本語名: ユーザー ID
- データ型:
string - 説明: ユーザー ID。
度数分布表
select
user_id,
count(*) as record_count
from `enterprise-dw-376005.mart.dim_user`
group by 1
order by 2 desc
limit 10
| user_id | record_count |
|---|---|
| [email protected] | 6 |
| N000020001 | 6 |
| N000020006 | 6 |
| N000020008 | 6 |
| N000020009 | 6 |
| N000020010 | 6 |
| N000020011 | 6 |
| N000020012 | 6 |
| N000020014 | 6 |
| N000020015 | 6 |
5. stream_id
- 日本語名: ストリーム ID
- データ型:
string - 説明: ストリーム ID。
度数分布表
select
stream_id,
count(*) as record_count
from `enterprise-dw-376005.mart.dim_user`
group by 1
order by 2 desc
limit 10
| stream_id | record_count |
|---|---|
| R1092 | 1708874 |
| R1093 | 913292 |
| R1057 | 424192 |
| A14G6FT26TR5V7 | 247292 |
| R1072 | 228239 |
| 354955 | 118523 |
| R1230 | 92014 |
| A2YRMTPJT0EVM5 | 72622 |
| AV6FJ6KIMD5OM | 62264 |
| 334924 | 36238 |
6. company_id
- 日本語名: 会社 ID
- データ型:
string - 説明: 会社 ID。
度数分布表
select
company_id,
count(*) as record_count
from `enterprise-dw-376005.mart.dim_user`
group by 1
order by 2 desc
limit 10
| company_id | record_count |
|---|---|
| hugkumi | 2108400 |
| from | 1250391 |
| tellas | 510466 |
| shikinoya | 102888 |
| im | 23360 |
| null | 1 |
7. gender
- 日本語名: 性別(社会的)
- データ型:
string - 説明: 性別(社会的)。
度数分布表
select
gender,
count(*) as record_count
from `enterprise-dw-376005.mart.dim_user`
group by 1
order by 2 desc
limit 10
| gender | record_count |
|---|---|
| 女性 | 2862530 |
| 男性 | 591464 |
| 不明 | 541511 |
| 1 | 1 |
8. birth_date
- 日本語名: 生年月日
- データ型:
date - 説明: 生年月日。
度数分布表
select
birth_date,
count(*) as record_count
from `enterprise-dw-376005.mart.dim_user`
group by 1
order by 2 desc
limit 10
| birth_date | record_count |
|---|---|
| null | 617660 |
| 1970-01-01 | 28489 |
| 1980-01-01 | 27087 |
| 1950-01-01 | 11377 |
| 1975-01-01 | 11144 |
| 2021-01-01 | 1253 |
| 1900-01-01 | 986 |
| 1985-01-01 | 825 |
| 1960-01-01 | 801 |
| 2000-01-01 | 703 |
9. current_age
- 日本語名: 現在の年齢
- データ型:
int64 - 説明: 現在の年齢。
度数分布表
select
current_age,
count(*) as record_count
from `enterprise-dw-376005.mart.dim_user`
group by 1
order by 2 desc
limit 10
| current_age | record_count |
|---|---|
| null | 617660 |
| 55 | 116002 |
| 45 | 112350 |
| 50 | 110719 |
| 51 | 101091 |
| 52 | 99038 |
| 49 | 97443 |
| 54 | 95378 |
| 53 | 94944 |
| 48 | 92373 |
10. current_age_bin
- 日本語名: 現在の年齢幅(10 歳区切り)
- データ型:
string - 説明: 現在の年齢幅(10 歳区切り)。
度数分布表
select
current_age_bin,
count(*) as record_count
from `enterprise-dw-376005.mart.dim_user`
group by 1
order by 1
limit 10
| current_age_bin | record_count |
|---|---|
| null | 617660 |
| 0-9 | 8265 |
| 10-19 | 15906 |
| 20-29 | 201613 |
| 30-39 | 567365 |
| 40-49 | 874248 |
| 50-59 | 931756 |
| 60-69 | 529770 |
| 70-79 | 203242 |
| 80- | 45681 |
11. current_age_bin_ga
- 日本語名: 現在の年齢幅(GA 区切り)
- データ型:
string - 説明: 現在の年齢幅(GA 区切り)。
度数分布表
select
current_age_bin_ga,
count(*) as record_count
from `enterprise-dw-376005.mart.dim_user`
group by 1
order by 1
limit 10
| current_age_bin_ga | record_count |
|---|---|
| null | 617660 |
| 0-17 | 14742 |
| 18-24 | 70657 |
| 25-34 | 377529 |
| 35-44 | 723911 |
| 45-54 | 981728 |
| 55-64 | 751674 |
| 65-74 | 331277 |
| 75- | 126328 |
ER 図
論理レイヤー
1. user_dimension
基本情報
user_dimension:
description: "ユーザー・ディメンションテーブル"
location: "dbt Semantic Layer"
primary_key: "user_key"
foreign_keys: ["first_order_date_key", "first_product_key"]
agg_time_dimension: null
ディメンショナル属性
1. user_id
- 日本語名: ユーザー ID
- データ型:
categorical - 説明: ユーザー ID。
2. gender
- 日本語名: 性別(社会的)
- データ型:
categorical - 説明: 性別(社会的)。
3. current_age_bin
- 日本語名: 現在の年齢幅(10 歳区切り)
- データ型:
categorical - 説明: 現在の年齢幅(10 歳区切り)。
4. current_age_bin_ga
- 日本語名: 現在の年齢幅(GA 区切り)
- データ型:
categorical - 説明: 現在の年齢幅(GA 区切り)。
メジャー属性
なし
メトリクス
なし