シンギュラリティ対策室

シンギュラリティは本当にくるのか?人工知能分野(おもに機械学習)の学習。その他いろいろ。

Python始めたばかりでscikit-learnのirisデータセットって何?を調べてみる

Python新人の私が、先輩に教えてもらいながらPythonをインストールし、

さて、機械学習とは何だろう?と、

色々な本や記事を読んで過ごすうちに。

調べていると、

どうやら機械学習には、Pythonで使えるライブラリの

「scikit-learn」が多く使われているということがわかりました。

このブログの初期にあるAnaconda3のインストール記事も参考にしながら

ケーブルカーで行こう! - シンギュラリティ対策室

なんとかscikit-learnを使える環境を構築。

アヤメの計測のデータセット [Iris Data Set]

UCI Machine Learning Repository: Iris Data Set

が一緒にインストールされているという部分まで行きつき、

では、このデータセットをどう使おうか?まできました。

調べていると、

どうやら

  • from sklearn.datasets import load_iris

  • iris = load_iris()

で読み込み、

データセットの項目 sepal length、sepal width、petal length、petal width、 をpandasを使いそれぞれA、B、C、Dと読み込み表示。

  • import pandas as pd

  • pd.DataFrame(iris.data, columns=list(“ABCD”))

list(“ABCD”)をiris.feature_namesという風にも表現可能らしい。

これでPython上で一旦表示されました。

さらに、

  • iris.target

で分類表示が出来る模様。

今日は何が言いたいかと言いますと、

アヤメの計測のデータセットPythonで表示させることが出来た、という進歩があったということです。

活用へとつづく、、、。