Skip to content

글자만 뽑기 · PDF → 텍스트

텍스트 추출

PDF 본문 글자를 뽑아 복사하거나 .txt로 저장합니다. 스캔본은 OCR이 필요합니다.

복사 또는 .txt100% 브라우저 처리

프라이버시. 꼼수 없음

파일은 당신 기기 밖으로 안 나갑니다.

업로드도 없고, 서버도 안 거칩니다. 모든 작업은 브라우저 안에서 끝납니다. 마음 편히 쓰세요.

이렇게 쓰세요

  1. 1. 텍스트를 뽑을 PDF를 불러옵니다.
  2. 2. 브라우저 안에서 추출을 실행합니다.
  3. 3. 텍스트를 복사하거나 .txt로 다운로드합니다.

문서 불러오기

원본 문서

PDF를 올리면 브라우저가 모든 페이지에서 텍스트를 뽑습니다.

파일을 끌어다 놓거나 클릭해서 선택하세요.

원본 파일

아직 선택된 문서가 없습니다.

출력

추출된 텍스트는 일반 텍스트입니다. 복사하거나 .txt로 저장하세요.

글자만 뽑아내기

PDF 텍스트 추출 — 업로드 없이 글자만 뽑기

무료

문서가 아니라 글자가 필요할 때가 있습니다. 인용할 한 문단, 번역할 단락, 검색할 보고서 같은 거죠. PDFTasker는 PDF의 텍스트 레이어를 브라우저 안에서 읽어, 복사하거나 .txt로 저장하게 돌려줍니다. 문서는 업로드되지 않습니다. 글자를 뽑을 만한 파일은 대개 남에게 보이고 싶지 않은 것들이라 이 점이 중요합니다.

프라이버시와 신뢰

업로드 없는 텍스트 추출

텍스트 추출은 그냥 읽기만 하는 작업입니다. 브라우저가 PDF를 화면에 띄울 때 하는 바로 그 일이라, 파일을 서버로 보낼 이유가 없습니다. PDFTasker는 텍스트 레이어를 기기 안에서 파싱해 몇 초 만에 일반 텍스트로 돌려줍니다. 스캔본은 읽을 텍스트 레이어가 없어 OCR이 필요하고, 실제 글자가 있는 문서는 모두 기기 안에서 끝납니다.

사용 가이드

PDF에서 텍스트 추출하는 법

  1. 01텍스트를 뽑을 PDF를 올립니다.
  2. 02추출을 실행하면 브라우저가 모든 페이지를 읽습니다.
  3. 03결과 영역에서 추출된 텍스트를 확인합니다.
  4. 04텍스트를 복사하거나 .txt 파일로 다운로드합니다.

자주 묻는 질문

PDF 텍스트 추출 자주 묻는 질문

텍스트 추출은 어떻게 동작합니까?

브라우저가 PDF를 화면에 띄울 때 쓰는 엔진으로, 대부분의 PDF가 화면 뒤에 담고 있는 텍스트 레이어를 읽습니다. 사이트가 한 번 열리면 전부 기기 안에서 처리되어 문서가 업로드되지 않습니다. 대부분의 문서는 몇 초 안에 텍스트가 나오고, 복사하거나 .txt로 저장할 수 있습니다.

결과가 왜 비어 있습니까?

아무것도 안 나오면 그 PDF는 대부분 스캔본입니다. 글자 레이어 없이 페이지를 찍은 이미지인 거죠. 추출은 파일 안에 실제로 저장된 글자만 읽을 수 있습니다. 스캔한 이미지를 글자로 바꾸려면 OCR(문자 인식)이 필요한데, 그림에서 글자를 읽어 내는 별도 작업입니다.

문서가 어디로 업로드됩니까?

안 올라갑니다. PDF는 브라우저 안에서 읽히고 추출된 텍스트도 기기 밖으로 나가지 않습니다. 텍스트를 뽑는 문서는 계약서, 보고서, 명세서처럼 비공개로 둘 만한 게 많아서 이 점이 중요합니다. 끝나면 탭을 닫는 것으로 충분하고, 서버에 남는 게 없습니다.

서식도 그대로 유지됩니까?

줄바꿈이 있는 읽기 좋은 텍스트가 나오지만, 단 나누기·표·머리말·글꼴 같은 레이아웃은 그대로 살리지 못합니다. 2단 편집 페이지는 순서가 뒤섞여 읽힐 수 있고, 표는 한 줄로 풀어져 나옵니다. 그냥 읽거나 검색하거나 다른 곳에 붙여 넣기엔 충분하지만, 정확한 레이아웃이 필요하면 원본 PDF를 쓰세요.

한국어나 다른 언어도 됩니까?

됩니다. PDF에 실제 텍스트 레이어가 있으면 언어는 상관없습니다. 한국어, 영어, 숫자, 섞인 내용 모두 똑같이 추출됩니다. 유일하게 안 되는 경우는 글자 레이어가 없는 스캔 이미지인데, 이는 언어와 무관하게 추출이 아니라 OCR이 필요합니다.