노션 PDF 데이터 가져오는 방법에 대해서 알아본다.
2024년 5월 최근 노션에서 PDF 문서의 데이터를 가져오는 새로운 기능이 추가되었다. 기존에는 PDF 문서를 임베드나 페이지에 저장의 기능만 있었던 반면 이 업데이트는 데이터 자체를 노션 스타일로 변환하는 기능인 것이다.
노션과 PDF 문서의 만남
노션에는 PDF 문서를 저장의 목적으로만 사용할 수 있었다. 파일을 드래그 해서 노션 페이지에 제목만 표시하여 저장하는 파일 관리의 역할과 임베드를 통해서 PDF를 노션 밖의 폴더에 접근하는 방식으로 기능이 구성되어 있었다.
엑셀이나 워드 문서는 얼마든지 CSV 파일로 노션의 가져오기(Import) 기능을 통해서 문서 내부의 텍스트와 그림 데이터를 노션 페이지로 불러올 수 있었다. 페이지를 불러오면 그 때 부터 노션 페이지내의 텍스트와 그림으로 변경되는 것이다. 이때부터 자유롭게 수정도 가능하고 노션 데이터베이스로 구성해서 관리할 수도 있다.
PDF 기능에서는 이러한 기능이 부족했지만 이번 업데이트가 이러한 노션과 PDF의 완벽하지 않은 부분을 많이 해결해주었다. 이미 구글에서는 구글 드라이브가 AI에 의해서 이러한 PDF 문서가 구글 독스나 워드 파일로 전환될 수 있도록 기능을 지원하고 있다. 따라서 노션의 이번 업데이트는 상당히 트렌드를 잘 따르는 것으로 보인다.
노션 PDF 데이터 가져오는 방법
샘플로 마이크로소프트 word 문서의 새로 만들기에서 제공하는 서식폼을 pdf 변환한 뒤 노션으로 불러오는 작업을 해보았다. 제목을 비롯한 많은 텍스트들로 문장이 구성됨과 동시에 다음과 같이 이미지 파일위에 텍스트가 입력되어 있다. 이러한 형태의 문서를 가져올 때 과연 노션이 어디까지 인식하고 변환할 수 있는지가 궁금했기 때문이다.
노션 페이지에서 명령어 /pdf를 입력하면 아래와 같이 임베드 외에 베타 버젼의 가져오기 기능이 추가되었다. 가져오기를 실행해보자.
그러면 엑셀이나 워드 문서를 가져오는 것과 마찬가지로 Import가 실행된다. 가져올 pdf 문서를 선택 후 열기를 누른다.
과연 결과는 어떨까? 정말 싱크로율 100%로 텍스트와 이미지를 가지런하게 잘 불러올 수 있을까? 아직 베타 버젼이라 추후 성능 업데이트가 기대되지만 아직은 필자가 100% 만족할만한 결과는 아니었다.
이미지 위에 있는 텍스트는 이미지 밖으로 밀려났다.
텍스트의 굵기(볼드체)는 잘 전환이 되었지만, 크기 등은 동일하게 전환되지 않았다.
구글 드라이브의 기능과 비교하면 약간 떨어지는 결과를 보여주었지만 어디까지나 베타 버전이고 노션으로 데이터를 임베드가 아닌 실제로 가져올 수 있는 있는 것 만으로도 유용한 기능이고 많은 유저들이 기다려왔을 것이라고 생각한다. 텍스트는 정말 만족스럽게 데이터를 불러올 수 있다는 점을 고려하면 많은 양의 문서를 불러올 때 상당히 유용한 기능이라고 생각한다.
구글 드라이브를 활용한 PDF 문서를 워드로 변환하는 방법은 아래 링크를 참고.
노션 페이지에 PDF 파일 저장과 임베드
명령어 /pdf를 입력하고 임베드를 하면 노션에는 따로 저장하지 않으면서 페이지에서 pdf 문서로 접근이 가능하다. 그리고 부분적으로 pdf 문서내부의 데이터를 볼 수 있다.
페이지에 저장을 할 수도 있다. 파일을 드래그해서 페이지에 던지기만 하면 된다. 하지만 요금제에 따라서 5Mb 이상의 파일은 무료 요금제 사용자에게는 제한될 수 있으니 참고해서 사용하기 바란다. 임베드 기능을 사용할 때는 저장하지 않는 대신 대용량의 파일로 임베드를 시킬 수 있다.
노션 PDF 데이터 가져오는 방법에 대해서 알아 보았다. 엑셀 데이터를 노션으로 불러오는 꿀팁은 아래 링크를 참고 바람.