データ分析

1/2ページ
  • 2019.09.11

[pandas] Excelファイルへの書き出し

pandas.DataFrame.to_excel()  pandas.DataFrame.to_excel() を使うと、データフレームを Excelファイルに書き出すことができます。引数で指定したファイル名がすでに存在している場合はファイルを上書きし、存在しない場合は新規ファイルを作成します。Excel ファイルから読み込んだデータをデータフレームに格納する関数については以下の記事を参照してく […]

  • 2019.09.10

[pandas] Excelファイルの読み込み

pandas.read_excel()  pandas.read_excel() を使うと、Excel ファイルをデータフレームに読み込むことができます。この関数は xls と xlsx ファイルをサポートします。xls は Excel 2003 以前、xlsx は Excel 2007 以降のバージョンで使用されている Excel ファイルの形式です。データフレームを Excel ファイルへ書き […]

  • 2019.07.10

[pandas] GroupBy

≪ [前の記事] 集約メソッド   groupby操作  部分的なデータについての集約は、groupby とよばれる操作によって実現できます。  具体例を使って説明するために、重複ラベルを含むデータフレームを作成しておきます。 # PANDAS_GROUPBY_BASIC # In[1] import numpy as np import pandas as pd # 重複要素を含むデ […]

  • 2019.07.09

[pandas] 集約メソッド

≪ [前の記事] pandas.merge() データの集約  pandas の Series や DataFrame には列について合計や平均、標準偏差などを求める 集約メソッド が用意されています。以下のコードで太陽系の惑星一覧表を取得して DataFrame を作成します (planets.csv は Wikipedia から得たデータを元に作成しました)。 # PANDAS_A […]

  • 2019.07.08

pandas.merge()

≪ [前の記事] pandas.concat()   pandas.merge()  pandas.merge() はデータセットを横方向に連結し、重複項目を適切な形で保存する機能をもっています。 キーの自動選択  具体例を使って説明します。最初に社員ID、氏名・年齢・所属部署が記録されたデータフレームを作成しておきます。 # PANDAS_MERGE # In[1] import n […]

  • 2019.07.05

pandas.concat() によるデータセットの連結

≪ [前の記事] 欠損値の処理 pandas.concat() によるデータセットの連結  pandas.concat() はデータセットの連結に用いられる関数です。  最初に重複ラベルのない Series 同士を連結してみます。 # PANDAS_CONCAT_01 # In[1] import numpy as np import pandas as pd # Seriesオブジェ […]

  • 2019.07.04

[pandas] 欠損値 (NA) の処理

≪ [前の記事] Index属性   [pandas] 欠損値 (NA) の処理  一般に pandas ではデータの 欠損値 (NA : Not Available) に NaN (Not a Number) とよばれる特殊な浮動小数点数を割り当てます。たとえば、互いに異なるラベルをもつ Series 同士で演算を実行すると NaN が現れます。 # PANDAS_NA_01 # I […]

  • 2019.06.27

[pandas] インデクス属性

  ≪ [前の記事] Indexオブジェクト   インデクス属性  Series や DataFrame には、要素を抽出するためのインデクス属性 (loc, iloc, at, iat) が備えられています。 loc, iloc  Series や DataFrame の要素の参照方法は、時としてユーザーを混乱させることがあります。たとえば、次のように偶数ラベルを付した Series […]

  • 2019.06.15

[pandas] Indexオブジェクト

  ≪ [前の記事] DataFrameオブジェクト   [pandas] Indexオブジェクト  Seriesオブジェクトや DataFrameオブジェクトのラベリングに用いられる Indexオブジェクト は pandas.Index() を使って生成することもできます。 # PANDAS_INDEX_01 # In[1] # Indexオブジェクトを生成 idx_1 = pd.I […]

  • 2019.06.14

[pandas] DataFrameオブジェクト

≪ [前の記事] Seriesオブジェクト   [pandas] DataFrameオブジェクト  pandas.DataFrame は NumPy の二次元配列に行方向 (axis=0) と列方向 (axis=1) のラベルを割り当てたオブジェクトです。 DataFrame の作成  pandas.DataFrame() に二次元配列を渡すと、行と列に 0 から始まる整数が自動的に割 […]