파이썬에서
버전 1
다음과 같은 날짜 포맷을
2020. 1. 23.
. 2020. 3. 4.
아래와 같이 변환하고자 한다.
2020-01-23
date_row 부분에 변경하고자 하는 내용을 배열로 넣어준다.
date_list = pd.DataFrame(date_row, columns=['date'])
date_list['date'] = date_list['date'].str.replace('. ', '-')
date_list['date'] = date_list['date'].str.replace('.', '-')
date_list['date'] = date_list['date'].str.strip('-')
date_list['date'] = pd.to_datetime(date_list['date'], format ='%Y-%m-%d')
print(date_list['date'])
아래 이미지 처럼 변환된 내용을 확인할 수 있다.
버전2
영어로 월이 표시되어 있는 날짜를 변환하고자 한다.
date_row 부분에 변경하고자 하는 내용을 배열로 넣어준다.
# 변환하고자 하는 날짜 DataFrame 으로 만들기 (date_row)
date_list = pd.DataFrame(date_row, columns=['date'])
date_list = date_list['date'].str.split('/')
date_list = date_list.apply(lambda x: pd.Series(x))
# '/' 기준으로 나누고 원하는 인덱스위치로 사용 ( [3] )
date_list[3] = pd.DataFrame(date_list[3].str.replace('Published: ', '-'))
date_list[3] = pd.DataFrame(date_list[3].str.replace(' ', '-'))
date_list[3] = pd.DataFrame(date_list[3].str.replace('--', ''))
#기존 데이터가 [날짜-영어월-년도] 로 표현되어 있어 아래와 같이 영어 달은 B 로 표기
date_list[3]=pd.to_datetime(date_list[3], format ="%d-%B-%Y")
print(date_list[3])
반응형
'프로그래밍 언어 > Python' 카테고리의 다른 글
[python] 배열 뒤에서부터 출력 [::] (0) | 2022.02.02 |
---|---|
[python error] 'euc_kr' codec can't decode byte 0xbf in position 2: illegal multibyte sequence (0) | 2022.02.01 |
[python] dataframe 숫자만 추출, 숫자+문자 추출 (데이터 전처리) (0) | 2022.01.26 |
[python] 'in <string>' requires string as left operand, not float (0) | 2022.01.26 |
[python] dataframe 컬럼명 변경하기 (0) | 2022.01.26 |