1. 데이터 읽어오기
# as 명령어로 pd 별칭 지정하기
import pandas as pd
# train.csv, test.csv, sample_submission.csv 파일을 읽어옵니다.
train = pd.read_csv('train.csv')
test = pd.read_csv('test.csv')
submission = pd.read_csv('sample_submission.csv')
2. 데이터 확인하기
# 데이터의 개수, 열 이름, 결측값의 수, 데이터 타입 등을 확인할 수 있습니다.
train.info()
3. Column 열 확인
train.columns()
4. 데이터 기술 통계량 확인
train.describe()
5. 무작위 샘플데이터 확인하기
train.sample(10)
6. 원하는 열의 평균값 얻기
mean_target = train['열 이름'].mean()
mean_target
7. 데이터 프레임 csv 파일로 저장 후 확인
# to_csv를 통해 폴더에 저장
submission.to_csv('submission.csv', index = False)
'프로그래밍 > 프로젝트' 카테고리의 다른 글
ARIMA 모델 (0) | 2024.05.21 |
---|---|
데이콘 - 고객 대출 등급 분류 프로젝트 (1) | 2024.02.09 |
고객 유지를 위한 필요한 행동 예측 (1) | 2024.01.14 |
원본 데이터 보존 (0) | 2023.11.28 |
머신러닝 기초 및 순서 (0) | 2023.11.21 |