MENU
  • ホーム
  • Contact Us
Hayashi's discovery-oriented learning | 地域研究と分析の林
地域研究と分析の林
  • ホーム
  • Contact Us
地域研究と分析の林
  • ホーム
  • Contact Us
Youtubeチャンネルはこちら(鉄道趣味メイン)
  1. ホーム
  2. データ前処理と即席可視化
  3. 逆引き こんなときこうした集

逆引き こんなときこうした集

データフレームの任意の行の型の種類と数を調べる

df['col_A'].apply(lambda x: type(x).__name__).value_counts()
table(sapply(df$col_A, function(x) class(x)))

DataFrameを構成する1つのSeriesの中に存在するfloat型の要素とstr型の要素の数を数える

# float型の要素の数を数える
float_count = sum(isinstance(x, float) for x in df['col_A'])

# str型の要素の数を数える
str_count = sum(isinstance(x, str) for x in df['col_A'])

print(f"Floatの数: {float_count}")
print(f"Strの数: {str_count}")
# float型の要素の数を数える
float_count <- sum(sapply(df$col_A, is.numeric))

# str型の要素の数を数える
str_count <- sum(sapply(df$col_A, is.chracter))

str型であるデータを抽出する

str_data = [x for x in df['col_A'] if isinstance(x, str)]
str_data <- df$col_A[sapply(df$col_A, is.character)]

データフレームの中から複数の列(col_A, col_B, col_C, col_D)を選択して以後操作を行う。
その中の1列(col_A)について、col_A列の要素が最大であるものの行を複数列分(col_A, col_B, col_C, col_D)抽出したい

df.loc[df['col_A'].idxmax(), ['col_B','col_C','col_D']]
## 準備中

col_Aからの抽出条件が単なる最大、最小ではなく値の範囲に条件がある場合

df[(df['col_A']>=10) & (df['col_A']<300)][['col_B','col_C','col_D']]
## 準備中
新着記事
  • 鳳派出所の風景(後編)
  • 鳳派出所の風景(中編)
  • 鳳派出所の風景(前編)
おすすめ

Youtubeチャンネル
https://www.youtube.com/watch?v=w2q30VHcXj4
  • ホーム
  • Contact Us

© 地域研究と分析の林.