데이터를 관리하면서 pdf 파일을 엑셀이나 구글 시트 문서로 불러와야 할 경우가 상당히 많습니다. Pdf 파일을 엑셀이나 구글 시트로 불러올 수도 있고 pdf파일의 테이블만 엑셀에서 편집/가공할 수 있습니다. PDF 테이블 엑셀 변환과 구글 시트로 불러오는 방법을 설명합니다.

파워 쿼리를 통한 PDF 테이블 엑셀 변환
PDF 파일을 엑셀로 변환할 때에는 파워쿼리를 이용해야 합니다. 파워쿼리를 사용하면 데이터 관리 차원에서 엄청나게 많은 부분을 자동할 수 있습니다. 엑셀이나 각종 데이터베이스 및 웹크롤링 외에도 많은 다양한 데이터 편집 기능들을 사용할 수 있습니다. 이번 글에서는 PDF 테이블을 엑셀로 가져오고 파워쿼리를 통해 데이터를 가공하고 엑셀로 불러오는 방법을 설명하겠습니다.
엑셀의 데이터 – 데이터 가져오기 – 파일에서(F) – PDF에서(P) 를 클릭합니다.
이후에 파워쿼리 편집기가 실행 되고 불러올 테이블을 선택 후 데이터 변환을 클릭합니다. 지금 제가 사용하는 예제 PDF 파일에는 하나의 테이블만 있습니다. 하지만, 많은 테이블이 있을 경우에는 파워쿼리 편집기에서 테이블 별로 선택해서 편집을 할 수 있는 기능을 제공하고 있는데요, 그때는 여러 항목 선택을 클릭하고 여러개의 편집할 테이블을 클릭해서 데이터 변환을 클릭해서 사용할 수 있습니다.
데이터 변환에서 테이블을 편집할 수 있는데요. 간단히 날짜 지역 구분 항목을 머리글로 구성하는 편집을 해보겠습니다. 아래 사진을 보면 첫 번째 행 아래 2, 3번행이 빈 행입니다. 1,2,3 행을 제거후 날짜 지역 행을 머리글로 만들어 보겠습니다. 홈 – 상위 행 제거를 클릭합니다
상위 행 제거에서 3행 까지 삭제를 위해서 3을 입력 후 확인을 클릭합니다.
이제 날짜 지역 행을 머리리글로 설정하면 됩니다. 첫 행을 머리글로 사용을 클릭합니다.
첫 행이 머리글로 변경됬습니다.
닫기 및 로드를 클릭해서 표 형태로 새 워크시트 혹은 기존 워크시트 아무곳에 확인을 클릭하면 테이블 형태로 깔끔하게 pdf 테이블 엑셀 변환을 완료할 수 있습니다.
파워쿼리를 사용하면 PDF 테이블 엑셀 변환 외에도 많은 데이터 가공 기능을 사용할 수 있음으로 기능 사용법을 익혀두면 실무에 많은 도움이 됩니다.
PDF 파일 구글 시트로 불러오는 방법
파워쿼리 기능이 없는 구글 시트에서는 어떻게 PDF 파일을 구글 시트로 불러올 수 있을까요? 구글 드라이브에서 이 기능을 제공하고 있는 PDF 파일을 구글 문서로 불러오는 방법을 설명합니다.
먼저 pdf 파일을 구글 드라이브에 저장 후 구글 드라이브에서 이 기능을 실행할 수 있습니다. 구글 드라이브 PDF 파일 선택 – 연결 앱 – Google 문서를 클릭합니다.
구글 AI가 PDF 문서를 구글 독스로 변환했습니다. 파일의 크기에 따라 다르지만 변환된 속도가 매우 빠릅니다.
이 문서를 그대로 사용해도 되지만 테이블을 구글 시트를 통해 데이터 분석 자료로 활용한다면 저 테이블을 드래그 해서 그대로 구글 시트에 복사 붙여 넣기 하면 구글 시트 데이터로 바로 사용이 가능합니다.
PDF 및 사진 파일을 구글 독스의 텍스트로 변환 구글 공식 홈페이지 바로가기
엑셀, 구글 시트 중복 값 제거 바로가기
엑셀, 구글 시트 행열 고정 바로가기