Python始めたばかりでscikit-learnのirisデータセットって何?を調べてみる
Python新人の私が、先輩に教えてもらいながらPythonをインストールし、
さて、機械学習とは何だろう?と、
色々な本や記事を読んで過ごすうちに。
調べていると、
「scikit-learn」が多く使われているということがわかりました。
このブログの初期にあるAnaconda3のインストール記事も参考にしながら
なんとかscikit-learnを使える環境を構築。
アヤメの計測のデータセット [Iris Data Set]
UCI Machine Learning Repository: Iris Data Set
が一緒にインストールされているという部分まで行きつき、
では、このデータセットをどう使おうか?まできました。
調べていると、
どうやら
from sklearn.datasets import load_iris
iris = load_iris()
で読み込み、
データセットの項目 sepal length、sepal width、petal length、petal width、 をpandasを使いそれぞれA、B、C、Dと読み込み表示。
import pandas as pd
pd.DataFrame(iris.data, columns=list(“ABCD”))
list(“ABCD”)をiris.feature_namesという風にも表現可能らしい。
これでPython上で一旦表示されました。
さらに、
- iris.target
で分類表示が出来る模様。
今日は何が言いたいかと言いますと、
アヤメの計測のデータセットをPythonで表示させることが出来た、という進歩があったということです。
活用へとつづく、、、。