이번에는 BigQuery에 CSV 파일을 업로드 하는 방법을 살펴 보도록 하겠습니다
실습
구글 클라우드 콘솔에 들어갑니다
메뉴에서 BigQuery
를 찾아 클릭합니다
우선 테스트를 위해서 일반 database
에 해당하는 dataset
을 만듭니다
(화살표를 누르면 다음과 같이 뜹니다)
이름을 넣고, Data expiration
등도 선택할 수 있습니다.
ecommerce
라는 dataset
이 만들어 졌으니 테이블을 만들기 위해서 +
버튼을 누릅니다
그럼 다음과 같은 화면이 나오는데 아래 상자안에 있는 설정을 통해서 CSV 파일을 읽어올 수 있습니다
choose file
을 눌러서 컴퓨터에 저장된 csv파일
을 가져오겠습니다
여기서는 purchase_data를 가져와 보겠습니다
사용할 데이터는 다음과 같이 생겼습니다
먼저 Table name
을 넣어주고 여기서는 purchase
로 넣어주겠습니다
그 다음 스키마를 지정해주는 부분이 나오는데, 여기서는 Automatically detect
를 이용한 자동으로 스키마 가져오는 방법도 있고,
직접 넣어주는 방법도 있습니다. 자신의 데이터에 맞는 방법으로 넣어줍니다
만약 첫줄에 컬럼명이 있는경우 무시하기 위해서 Header rows to skip
을 설정해줍니다
그 다음 Create Table
을 누릅니다
그럼 다음과 같이 Table 생성을 위한 job
이 나옵니다
(저는 초기 스키마 설정을 몇번 잘못해 아래에 실패 job
들이 보입니다)
그 다음 쿼리를 날려서 실제 데이터가 잘 들어갔는지 확인을 해 봅니다
마무리
실제 CSV 파일
로 데이터를 가지고 있거나 한 경우에 엑셀로 돌리기 무거운 경우 이렇게 손쉽게 BigQuery
에 올려서 데이터를 손쉽게 핸들링 할 수 있습니다.