[Python] DataFrame

2024. 6. 13. 09:01·Programming Language/Python
# DataFrame 실습
df = pd.DataFrame({'a':[2,3], 'b':[5, 10]})
df

df = pd.DataFrame([[2, 5], [3, 10], [10, 20]], columns=['a', 'b'])
df

데이터프레임 행, 열 삭제

df.drop([지울 행이나 열], axis=축(0 or 1))

열 지울 땐 axis = 1

행 지울 땐 axis = 0

df.drop(['B', 'C'], axis=1)

inplace = True

  • 변수 할당 없이 변수에 적용하겠다는 뜻
df.drop(['B', 'C'], axis=1, inplace=True)

== 같은 뜻

df = df.drop(['B', 'C'], axis=1) 

계산 기능

  • mean() : 평균 값 구하기

데이터프레임 수정

# 1행의 C열의 값을 육으로 변경
df.loc[1, 'C'] = '육'

# 1행의 C의 값을 6으로 변경
df.iloc[1, 2] = 6

# 위 코드 두가지는 모두 동일한 뜻

조건 필터링 가져오기

  • 불린 형태로 가져오기 때문에 df[ ]로 묶어주기
df[df['age']>=30]

# df['age']>=30의 경우엔 불린형태로 가져옴

# job이 intern인 사람 가져오기
df['job'] == 'intern'

df[df['job'] == 'intern']

  • and, or 연산의 경우엔 ( )로 묶고 &, | 사용
# 조건 여러개
# 30대 이상 40대 이하
df[df['age'] >=30 & df['age'] <= 40]
>> 에러발생

df[(df['age'] >=30) & (df['age'] <= 40)]

# 조건 여러개
# 30대 미만 혹은 40대 초과
df[(df['age']<30) | (df['age']>40)]

  • in을 사용하려면 왼쪽에 단일값이 와야함
    • job에 있는 값은 lambda x에 넣을 건데 x가 ['student', 'manager']에 포함되니? 라고 묻는 것
    df['job'].apply(lambda x : x in ['student', 'manager'])
    
    # in을 통한 포함 조건 걸기
    df[df['job'].apply(lambda x : x in ['student', 'manager'])]
    

데이터프레임 복사 - df.copy()

  • 혹시 모룰 실수를 대비하여 복사한 값으로 사용하기
저작자표시 비영리 변경금지 (새창열림)

'Programming Language > Python' 카테고리의 다른 글

[Python] apply 함수  (0) 2024.06.13
[Python] DataFrame 그룹  (0) 2024.06.13
[Python] iloc와 loc  (0) 2024.06.13
[Python] Pandase(판다스)  (0) 2024.06.13
[Python] 시각화할 때 한글 깨지는 경우  (0) 2024.06.13
'Programming Language/Python' 카테고리의 다른 글
  • [Python] apply 함수
  • [Python] DataFrame 그룹
  • [Python] iloc와 loc
  • [Python] Pandase(판다스)
woojin._.
woojin._.
여러가지 개발을 해보며 발생하는 이야기들에 대한 블로그입니다:)
  • woojin._.
    Jin's Dev Story
    woojin._.
  • 전체
    오늘
    어제
    • 분류 전체보기 (829)
      • Tools (25)
        • eGovFrame (3)
        • GeoServer (3)
        • QGIS (2)
        • LabelImg (2)
        • Git (6)
        • GitHub (1)
        • Eclipse (7)
        • Visual Studio (1)
      • Web & Android (121)
        • SpringBoot (37)
        • Three.js (2)
        • Spring Data JPA (9)
        • 스프링 부트 쇼핑몰 프로젝트 with JPA (25)
        • Thymeleaf (4)
        • Spring Security (15)
        • Flutter (29)
      • Programming Language (61)
        • JAVA (27)
        • JavaScript (14)
        • Dart (2)
        • Python (15)
        • PHP (3)
      • Database (43)
        • PostgreSQL (32)
        • MYSQL (7)
        • Oracle (3)
        • MSSQL (1)
      • SERVER (17)
        • TCP_IP (3)
        • 리눅스 (7)
        • AWS (7)
      • Coding Test (445)
        • 백준[JAVA] (108)
        • 프로그래머스[JAVA] (260)
        • 알고리즘 고득점 Kit[JAVA] (3)
        • SQL 고득점 Kit[ORACLE] (74)
      • CS 지식 (49)
        • [자료구조] (14)
        • [네트워크] (12)
        • [데이터베이스] (10)
        • [알고리즘] (9)
        • [운영체제] (4)
      • 기타 (6)
      • 자격증 & 공부 (62)
        • 정보처리기사 (2)
        • SQLD (6)
        • 네트워크관리사 2급 (5)
        • 리눅스마스터 1급 (44)
        • 리눅스마스터 2급 (1)
        • ISTQB (3)
        • 시스템보안 (1)
  • 블로그 메뉴

    • 홈
    • 태그
    • 방명록
  • 인기 글

  • 태그

    backjoon
    프로그래머스
    스프링부트
    자바
    시큐리티
    Spring Security
    CS
    스프링
    spring
    baekjoon
    플러터
    programmers
    DB
    리눅스
    JPA
    python
    Oracle
    리눅스마스터 1급
    데이터베이스
    데이터
    postgresql
    리눅스마스터
    백준
    Linux
    Java
    Flutter
    스프링 부트 쇼핑몰 프로젝트 with JPA
    pcce 기출문제
    springboot
    CS지식
  • 최근 글

  • hELLO· Designed By정상우.v4.10.0
woojin._.
[Python] DataFrame
상단으로

티스토리툴바