CSV加工集計用サンプルデータ

データ加工・集計の練習に最適なサンプルデータセット

欠損値あり
重複行あり
異常値あり
加工練習用
使い方:
  1. お好みのデータセットをダウンロードします
  2. CSV加工集計ページでファイルをアップロードします
  3. 欠損値処理、データ型変換、集計などの加工処理を練習します
  4. 処理結果をダウンロードして確認します

サンプルデータセット一覧

様々な加工課題を含む実用的なデータセット

アイリス花の分類データ

分類問題

アイリス花の特徴から種類を分類するデータセット。
欠損値が含まれており、データクリーニングの練習に最適です。

150 レコード
6 特徴量
15 欠損値
欠損値処理 分類問題 初心者向け
ダウンロード

ワインの品質分類データ

分類問題

ワインの化学成分から品質を分類するデータセット。
重複行が含まれており、重複削除の練習に最適です。

183 レコード
14 特徴量
14 欠損値
重複削除 欠損値処理 分類問題
ダウンロード

乳がん診断データ

分類問題

乳がん細胞の特徴から良性・悪性を診断するデータセット。
医療分野でのデータ前処理の練習に最適です。

569 レコード
32 特徴量
20 欠損値
欠損値処理 医療データ 分類問題
ダウンロード

売上分析データ

回帰問題

商品売上の時系列データセット。
欠損値と異常値が含まれており、データクリーニングの総合練習に最適です。

1,000 レコード
11 特徴量
100 欠損値
異常値検出 時系列データ 回帰問題
ダウンロード

従業員分析データ

混合問題

従業員の属性と業績データセット。
分類と回帰の両方の分析が可能で、集計分析の練習に最適です。

500 レコード
15 特徴量
65 欠損値
集計分析 ピボットテーブル 人事データ
ダウンロード

顧客分析データ

分類問題

顧客の属性と購買行動データセット。
顧客離脱予測の分類問題として、マーケティング分析の練習に最適です。

800 レコード
15 特徴量
85 欠損値
顧客分析 離脱予測 分類問題
ダウンロード

天気予測データ

時系列

1年間の天気データセット。
季節性を持つ時系列データで、時系列分析の練習に最適です。

365 レコード
11 特徴量
70 欠損値
時系列データ 季節性 予測問題
ダウンロード

さあ、データ加工を始めよう!

サンプルデータをダウンロードして、CSV加工集計ページで練習してみてください